Brain2Qwerty v2: Η νέα AI της Meta διαβάζει τη σκέψη χωρίς να χρειάζεται εμφύτευμα

Add as preferred source on Google

Σύνοψη

  • Η Meta ανακοίνωσε το Brain2Qwerty v2, ένα προηγμένο σύστημα τεχνητής νοημοσύνης ικανό να αποκωδικοποιεί εγκεφαλικά σήματα σε κείμενο σε πραγματικό χρόνο, αποκλείοντας την ανάγκη για επεμβατικά εμφυτεύματα.
  • Το σύστημα αξιοποιεί τη μαγνητοεγκεφαλογραφία (MEG) για τη λήψη δεδομένων και ενσωματώνει μεγάλα γλωσσικά μοντέλα (LLMs) για να οργανώσει τα νευρικά σήματα σε δομημένες προτάσεις.
  • Η μέση ακρίβεια αναγνώρισης λέξεων ανήλθε στο 61%, ενώ στην καλύτερη περίπτωση άγγιξε το 78%, προσφέροντας ρεαλιστικές λύσεις για ασθενείς με νευροεκφυλιστικές παθήσεις (π.χ. ALS, σύνδρομο εγκλεισμού).
  • Ο πηγαίος κώδικας των μοντέλων Brain2Qwerty v1 και v2 καθίσταται διαθέσιμος ανοιχτά (open-source), επιτρέποντας σε ερευνητικά κέντρα παγκοσμίως να επιταχύνουν τις νευροεπιστημονικές τους μελέτες.
  • Η ανάπτυξη υποστηρίχθηκε από "auto-research" AI agents, τα οποία βελτιστοποιούσαν αυτόνομα τον κώδικα του συστήματος για τη μείωση του ποσοστού σφάλματος (Word Error Rate).

Η επικοινωνία μέσω αποκλειστικής χρήσης της σκέψης προχωρά από το στάδιο της θεωρητικής έρευνας στην πρακτική υλοποίηση, χάρη στις ραγδαίες εξελίξεις της τεχνητής νοημοσύνης. Η Meta ανακοίνωσε επίσημα το Brain2Qwerty v2, την αναβαθμισμένη έκδοση του συστήματος μεταγραφής εγκεφαλικής δραστηριότητας σε κείμενο. Το συγκεκριμένο μοντέλο ξεχωρίζει για τον μη επεμβατικό του χαρακτήρα, αποφεύγοντας τις περίπλοκες και δαπανηρές χειρουργικές επεμβάσεις που απαιτούν άλλα νευροπροσθετικά συστήματα. Η εξέλιξη αυτή απευθύνεται άμεσα σε εκατομμύρια ασθενείς που πάσχουν από νευροεκφυλιστικές διαταραχές, όπως η αμυοτροφική πλευρική σκλήρυνση (ALS) και η αναρθρία, εμποδίζοντας την ικανότητά τους να μιλήσουν ή να κινηθούν.

Πώς λειτουργεί η αρχιτεκτονική του Brain2Qwerty v2;

Το Brain2Qwerty v2 συλλέγει δεδομένα μέσω μαγνητοεγκεφαλογραφίας (MEG), μεταφράζοντας τα μικροσκοπικά μαγνητικά πεδία του εγκεφάλου σε tokens (χαρακτήρες). Στη συνέχεια, ένα αυτόνομο σύστημα ευθυγράμμισης σχηματίζει λέξεις, ενώ ένα Μεγάλο Γλωσσικό Μοντέλο (LLM) αναλαμβάνει τη σύνθεση δομημένων, κατανοητών προτάσεων σε πραγματικό χρόνο, γεφυρώνοντας το χάσμα μεταξύ θορυβωδών νευρικών καταγραφών και φυσικής γλώσσας.

Η καινοτομία εντοπίζεται στην αλυσίδα επεξεργασίας. Τα παραδοσιακά μοντέλα βασίζονταν σε χειροκίνητα κατασκευασμένες διοδεύσεις για την ανίχνευση των νευρικών γεγονότων. Η Meta, αντίθετα, εφαρμόζει end-to-end βαθιά μάθηση για την απευθείας αποκωδικοποίηση των ακατέργαστων εγκεφαλικών σημάτων. Τα LLMs, βασισμένα στην τεχνογνωσία μοντέλων όπως το Llama, αναλαμβάνουν τον κρίσιμο ρόλο της κατανόησης του σημασιολογικού πλαισίου. Το μοντέλο δεν μαντεύει απλώς γράμματα, αλλά συνδυάζει την καταγραφή με τα γλωσσικά μοτίβα για να διορθώσει τον αναπόφευκτο «θόρυβο» των μαγνητοεγκεφαλογραφημάτων.

Αυτό το πολυεπίπεδο ιεραρχικό σύστημα αποτελεί την πρώτη επιτυχημένη ανάπτυξη ενός LLM για τη μετάφραση εγκεφαλικής δραστηριότητας σε κείμενο, ανοίγοντας τον δρόμο για μελλοντικές νευροδιεπαφές (brain-computer interfaces - BCI) που δεν απαιτούν την τοποθέτηση ηλεκτροδίων μέσα στον εγκεφαλικό φλοιό.

Ποια είναι τα ακριβή ποσοστά επιτυχίας του νέου μοντέλου;

Το Brain2Qwerty v2 επιτυγχάνει μέσο ποσοστό ακρίβειας λέξεων 61% σε συνθήκες μη επεμβατικής καταγραφής, αφήνοντας πίσω το προηγούμενο όριο του 8% άλλων μη επεμβατικών μεθόδων. Στον κορυφαίο συμμετέχοντα της μελέτης, το σύστημα κατέγραψε εντυπωσιακή ακρίβεια 78%, αποκωδικοποιώντας πάνω από τις μισές προτάσεις με μέγιστο περιθώριο σφάλματος μίας μόνο λέξης.

Για να επιτευχθούν αυτά τα νούμερα, το μοντέλο εκπαιδεύτηκε πάνω σε ένα τεράστιο σύνολο δεδομένων που συγκεντρώθηκε στο Βασκικό Κέντρο Γνωστικής, Εγκεφάλου και Γλώσσας (Basque Center on Cognition, Brain, and Language - BCBL) στην Ισπανία. Η διαδικασία αφορούσε 9 υγιείς εθελοντές (ηλικίας 25 έως 56 ετών), οι οποίοι κλήθηκαν να πληκτρολογήσουν συνολικά περίπου 22.000 προτάσεις κατά τη διάρκεια συνεδριών συνολικής διάρκειας 10 ωρών ο καθένας. Καθ' όλη τη διάρκεια της πληκτρολόγησης, η εγκεφαλική τους δραστηριότητα καταγραφόταν με συστήματα MEG. Οι ερευνητές διαπίστωσαν πως η ακρίβεια αποκωδικοποίησης αυξάνεται λογαριθμικά-γραμμικά σε σχέση με τον όγκο των δεδομένων εκπαίδευσης. Αυτό αποδεικνύει πως οι νόμοι κλιμάκωσης εφαρμόζονται και εδώ: όσο περισσότερα δεδομένα τροφοδοτούνται, τόσο το χάσμα απόδοσης μεταξύ μη επεμβατικών και χειρουργικών προσεγγίσεων θα μειώνεται.

Πώς συμβάλλουν τα αυτόνομα AI Agents στην ανάπτυξη;

Η Meta ενσωμάτωσε αυτόνομα ερευνητικά AI agents στη διαδικασία ανάπτυξης, τα οποία αναλαμβάνουν την επαναληπτική τροποποίηση του κώδικα και τη δημιουργία νέων, αποδοτικότερων αρχιτεκτονικών, μειώνοντας δραστικά το ποσοστό σφάλματος λέξεων (Word Error Rate - WER).

Αυτοί οι πράκτορες λειτουργούν ως ένας ακούραστος μηχανισμός βελτιστοποίησης, δοκιμάζοντας εκατοντάδες διαμορφώσεις και παραμέτρους ρουτίνας που θα απαιτούσαν χιλιάδες εργατοώρες από ανθρώπινους μηχανικούς. Ωστόσο, η ερευνητική ομάδα ξεκαθαρίζει στην τεχνική της δημοσίευση πως, αν και τα συστήματα τεχνητής νοημοσύνης λειτουργούν ως ισχυροί πολλαπλασιαστές ισχύος, ο ανθρώπινος παράγοντας παραμένει ο τελικός κριτής. Οι τελικές διαμορφώσεις εκπαίδευσης και η αξιολόγηση των νέων μεθοδολογιών εγκρίθηκαν και επιλέχθηκαν ρητά από τους μηχανικούς της Meta.

Τι σημαίνει η open-source στρατηγική για την κοινότητα;

Η απόφαση της Meta να δημοσιεύσει ανοιχτά (open-source) τον πλήρη κώδικα εκπαίδευσης για τα Brain2Qwerty v1 και v2, καθώς και το σετ δεδομένων του v1 μέσω του συνεργάτη της, στοχεύει στην αποφυγή της απομονωμένης έρευνας. Παρέχοντας ελεύθερη πρόσβαση σε αυτά τα νευρωνικά θεμελιώδη μοντέλα, η εταιρεία επιδιώκει την ταχύτερη ανάπτυξη ιατρικών και διαγνωστικών εργαλείων.

Η κίνηση αυτή υποστηρίζεται και από την ευρύτερη δέσμευση της εταιρείας για το "Digital Brain Project", ένα ταμείο 5 εκατομμυρίων δολαρίων που στοχεύει στη δημιουργία ανοιχτών δεδομένων για την εκπαίδευση μοντέλων. Τα εργαλεία NeuralSet (για την επεξεργασία δεδομένων εγκεφάλου σε μεγάλη κλίμακα) και NeuralBench (για τη συστηματική αξιολόγηση μοντέλων) συνθέτουν ένα οικοσύστημα που επιτρέπει σε τρίτους φορείς και ακαδημαϊκά ιδρύματα να ερευνήσουν χωρίς να απαιτείται να χτίσουν την τεχνολογία από το μηδέν.

Loading