Google DeepMind: Το όραμα της για τη δημιουργία ενός καθολικού AI βοηθού
Από τον Demis Hassabis, Διευθύνοντα Σύμβουλο του Google DeepMind
Επεκτείνουμε το Gemini, ώστε να γίνει ένα παγκόσμιο μοντέλο που να μπορεί να δημιουργεί σχέδια και να φαντάζεται νέες εμπειρίες προσομοιώνοντας πτυχές του κόσμου.
Την τελευταία δεκαετία, θέσαμε πολλά από τα θεμέλια του σύγχρονου AI, από την πρωτοποριακή αρχιτεκτονική Transformer στην οποία βασίζονται όλα τα μεγάλα γλωσσικά μοντέλα, έως την ανάπτυξη συστημάτων παραγόντων όπως το AlphaGo και το AlphaZero.
Εφαρμόμασαμε αυτές τις τεχνικές για να πραγματοποιήσουμε σημαντικές ανακαλύψεις στην κβαντική υπολογιστική, τα μαθηματικά, τις βιοεπιστήμες και την αλγοριθμική ανακάλυψη. Συνεχίζουμε να διπλασιάζουμε το εύρος και το βάθος της βασικής μας έρευνας με σκοπό να εφεύρουμε τις επόμενες μεγάλες ανακαλύψεις που είναι απαραίτητες για τη γενική τεχνητή νοημοσύνη (AGI).
Για τον λόγο αυτό, καταβάλλουμε προσπάθειες να επεκτείνουμε το καλύτερο πολυμεσικό θεμελιώδες μοντέλο μας, το Gemini 2.5 Pro, ώστε να γίνει ένα “παγκόσμιο μοντέλο” το οποίο θα μπορεί να κάνει σχέδια και να φαντάζεται νέες εμπειρίες προσομοιώνοντας πτυχές του κόσμου, όπως ακριβώς κάνει ο εγκέφαλος.
Προχωράμε προς αυτή την κατεύθυνση εδώ και λίγο καιρό, από τους πρωτοποριακούς μας παράγοντες εκπαίδευσης εργασίας μέχρι την εξοικείωση με σύνθετα παιχνίδια όπως το Go και το StarCraft, μέχρι το Genie 2, το οποίο είναι ικανό να δημιουργεί τρισδιάστατα προσομοιωμένα περιβάλλοντα με τα οποία υπάρχει δυνατότητα αλληλεπίδρασης, από μία απλή οδηγία.
Ήδη, μπορούμε να δούμε στοιχεία που δείχνουν ότι οι δυνατότητες αυτές αναδύονται στην ικανότητα του Gemini να χρησιμοποιεί τη γνώση και τον συλλογισμό του κόσμου για να αναπαριστά και να προσομοιώνει φυσικά περιβάλλοντα, στη βαθιά κατανόηση του Veo για τη διαισθητική φυσική αλλά και στον τρόπο με τον οποίο το Gemini Robotics διδάσκει τα ρομπότ να κατανοούν, να ακολουθούν οδηγίες και να προσαρμόζονται στη στιγμή.
Η μετατροπή του Gemini σε παγκόσμιο μοντέλο είναι ένα κρίσιμο βήμα στην ανάπτυξη ενός νέο, πιο γενικού και πιο χρήσιμου είδους AI — ενός καθολικού βοηθού AI. Πρόκειται για ένα AI που είναι έξυπνο, κατανοεί το πλαίσιο στο οποίο βρίσκεστε και μπορεί να οργανώσει και να αναλάβει δράση για λογαριασμό σας, μέσω οποιασδήποτε συσκευής.
Ενσωμάτωση των ζωντανών δυνατοτήτων του Project Astra στα προϊόντα μας
Το απώτερο όραμά μας είναι να μετατρέψουμε την εφαρμογή Gemini σε έναν καθολικό βοηθό AI που θα εκτελεί τις καθημερινές μας εργασίες, θα αναλαμβάνει τις βαρετές διαχειριστικές μας υποθέσεις και θα μας προτείνει ευχάριστες νέες ιδέες, κάνοντάς μας πιο παραγωγικούς και εμπλουτίζοντας τη ζωή μας
Αυτό ξεκινά με τις δυνατότητες που εξερευνήσαμε για πρώτη φορά πέρυσι στο ερευνητικό πρωτότυπο Project Astra, όπως η κατανόηση βίντεο, ο διαμοιρασμός οθόνης και η μνήμη.
Τον τελευταίο χρόνο, ενσωματώνουμε αυτές τις δυνατότητες στο Gemini Live ώστε να μπορούν να τις δοκιμάσουν όλοι. βελτιώνοντάς τες και εξερευνώντας νέες.
Συνεχίζουμε να τις βελτιώνουμε διαρκώς και να εξερευνούμε νέες καινοτομίες. Για παράδειγμα, αναβαθμίσαμε την έξοδο φωνής, ώστε να είναι πιο φυσική με εγγενή έξοδο ήχου, βελτιώσαμε τη μνήμη και προσθέσαμε έλεγχο από υπολογιστή.
Έχουμε ξεκινήσει να συλλέγουμε σχόλια από αξιόπιστους δοκιμαστές και εργαζόμαστε για να προσφέρουμε δυνατότητες όπως αυτές στο Gemini Live και σε άλλα προϊόντα, όπως η Αναζήτηση, το Live API για προγραμματιστές και σε νέους παράγοντες μορφής, όπως τα γυαλιά.
Σε κάθε βήμα αυτής της διαδικασίας, η ασφάλεια και η υπευθυνότητα βρίσκονται στο επίκεντρο της εργασίας μας. Στα μεγαλύτερα έργα πρόβλεψης ηθικής που έχουμε κάνει μέχρι σήμερα, διερευνήσαμε τα ζητήματα ηθικής που αφορούν τους προηγμένους βοηθούς AI και το έργο αυτό συνεχίζει να διαμορφώνει την έρευνα, την ανάπτυξη και την εξέλιξή μας.
Δημιουργία AI που κάνει πολλές εργασίες για εσάς
Διερευνούμε, επίσης, το πώς οι δυνατότητες παραγόντων μπορούν να βοηθήσουν τους χρήστες να κάνουν πολλές εργασίες, με το Project Mariner. Πρόκειται για ένα ερευνητικό πρωτότυπο που διερευνά το μέλλον της αλληλεπίδρασης ανθρώπου-παράγοντα, ξεκινώντας από τα προγράμματα περιήγησης.
Από την κυκλοφορία του Project Mariner τον περασμένο Δεκέμβριο, συνεργαζόμαστε στενά με μια ομάδα αξιόπιστων δοκιμαστών για να συλλέξουμε σχόλια και να βελτιώσουμε τις πειραματικές του δυνατότητες.
Το Project Mariner περιλαμβάνει πλέον ένα σύστημα παραγόντων που μπορούν να ολοκληρώσουν έως και δέκα διαφορετικές εργασίες ταυτόχρονα. Αυτοί οι παράγοντες μπορούν να σας βοηθήσουν να αναζητάτε πληροφορίες, να κάνετε κρατήσεις, αγορές, έρευνα και άλλα — ταυτόχρονα.
Το ενημερωμένο Project Mariner είναι διαθέσιμο στους συνδρομητές του Google AI Ultra στις ΗΠΑ. Φέρνουμε τις δυνατότητες χρήσης υπολογιστή στο Gemini API και σχεδιάζουμε να προσφέρουμε περισσότερες δυνατότητές σε περισσότερα προϊόντα Google κατά τη διάρκεια του έτους.
Διαβάστε περισσότερα για τις δυνατότητες των παραγόντων μας στην Αναζήτηση και στην εφαρμογή Gemini.
Με αυτό και με όλο το πρωτοποριακό μας έργο, δημιουργούμε AI που είναι πιο προσωπικό, προληπτικό και ισχυρό, εμπλουτίζοντας τη ζωή μας, προωθώντας τον ρυθμό της επιστημονικής προόδου και εγκαινιάζοντας μια νέα, χρυσή εποχή ανακάλυψης και θαυμάτων.