Gemma 3n: Το νέο προηγμένο AI μοντέλο της Google τρέχει τοπικά στις συσκευές των χρηστών
Στο φετινό συνέδριο Google I/O 2025, η Google αποκάλυψε μία σειρά από εντυπωσιακές εξελίξεις στον τομέα της τεχνητής νοημοσύνης. Πέρα από τη νέα έκδοση Gemini Flash 2.5, που είναι πλέον διαθέσιμη σε όλους, ξεχωρίζει η παρουσίαση του Gemma 3n, ενός μικρού αλλά εξαιρετικά αποδοτικού γλωσσικού μοντέλου που σχεδιάστηκε για να λειτουργεί τοπικά, απευθείας στις προσωπικές συσκευές των χρηστών.
Το Gemma 3n ενσωματώνει μια σημαντική καινοτομία που προέρχεται από τη Google DeepMind, γνωστή ως Per-Layer Embeddings (PLE). Αυτή η τεχνική επιτρέπει στο μοντέλο να μειώνει δραστικά τις απαιτήσεις σε μνήμη RAM, ενώ παράλληλα διατηρεί υψηλές επιδόσεις. Αν και το μοντέλο διατίθεται σε εκδόσεις 5 και 8 δισεκατομμυρίων παραμέτρων, η πραγματική επιβάρυνση στη μνήμη είναι αντίστοιχη με αυτή μοντέλων 2B και 4B, αντίστοιχα. Η Google αναφέρει ότι μπορεί να λειτουργεί με μόλις 2 έως 3 GB μνήμης, γεγονός που το καθιστά ιδανικό για κινητές συσκευές.
Η αποδοτικότητα του Gemma 3n ενισχύεται και από άλλες προηγμένες τεχνικές, όπως η μοιραζόμενη κρυφή μνήμη KVC και η ποσοτικοποίηση ενεργοποίησης, οι οποίες του επιτρέπουν να ανταποκρίνεται έως και 1,5 φορά ταχύτερα σε κινητές συσκευές, συγκριτικά με προηγούμενα μοντέλα όπως το Gemma 3 4B. Παράλληλα, διαθέτει τη δυνατότητα mix’n’match, μέσω της οποίας προσαρμόζει δυναμικά τον τρόπο λειτουργίας του για να ανταποκρίνεται καλύτερα σε διαφορετικά είδη χρήσης.
Ένα από τα μεγαλύτερα πλεονεκτήματα του Gemma 3n είναι το γεγονός ότι η εκτέλεση γίνεται τοπικά στη συσκευή του χρήστη. Αυτό σημαίνει ότι δεν απαιτείται σύνδεση στο Διαδίκτυο και κανένα δεδομένο δεν αποστέλλεται σε εξωτερικούς servers, διασφαλίζοντας πλήρη ιδιωτικότητα και ασφάλεια. Η δυνατότητα offline λειτουργίας το καθιστά ιδιαίτερα ελκυστικό για ευαίσθητες εφαρμογές ή περιβάλλοντα με περιορισμένη συνδεσιμότητα.
Το Gemma 3n είναι επίσης πιο ικανό στην κατανόηση πολυτροπικών εισόδων, καθώς μπορεί να επεξεργαστεί κείμενο, ήχο και εικόνα, και εμφανίζει σημαντικά βελτιωμένη απόδοση στην κατανόηση βίντεο. Μπορεί να πραγματοποιεί μεταγραφές, μεταφράσεις και να χειρίζεται πολύπλοκες διαδράσεις που συνδυάζουν διαφορετικές μορφές δεδομένων. Η προσέγγιση αυτή ανοίγει τον δρόμο για πιο «έξυπνες» εφαρμογές σε τομείς όπως η προσβασιμότητα, η εκπαίδευση και τα πολυμέσα.
Σημαντικές είναι επίσης οι βελτιώσεις στη γλωσσική πολυμορφία του μοντέλου. Η Google διαβεβαιώνει πως οι επιδόσεις του Gemma 3n είναι αισθητά ανώτερες σε μη αγγλικές γλώσσες, ιδιαίτερα στα ιαπωνικά, γερμανικά, κορεατικά, ισπανικά και γαλλικά, ενώ το μοντέλο σημείωσε 50,1% στον πολυγλωσσικό δείκτη WMT24++, επιβεβαιώνοντας την αποτελεσματικότητά του.
Οι χρήστες μπορούν να ξεκινήσουν να χρησιμοποιούν το Gemma 3n απευθείας από τον browser τους μέσω του Google AI Studio, χωρίς ανάγκη εγκατάστασης. Παράλληλα, οι προγραμματιστές έχουν τη δυνατότητα να το ενσωματώσουν τοπικά στις εφαρμογές τους μέσω του Google AI Edge, αποκτώντας πρόσβαση σε δυνατότητες κατανόησης και δημιουργίας περιεχομένου με κείμενο και εικόνα.
[via]