Σύνοψη
- Ο ασθενής Casey Harrell χρησιμοποίησε το εμφύτευμα BCI χωρίς τεχνική επίβλεψη για περισσότερες από 3.800 ώρες μέσα στην τελευταία διετία.
- Η τεχνολογία αποκωδικοποιεί τα νευρικά σήματα επιτρέποντας την παραγωγή ομιλίας με ρυθμό 56 λέξεων ανά λεπτό.
- Καταγράφηκε ποσοστό επιτυχίας 99% κατά τη χρήση ενός τεράστιου λεξιλογίου 125.000 λέξεων, εκπαιδεύοντας το σύστημα σταδιακά.
- Συνδυάζοντας speech decoding και movement BCI, ο χρήστης ελέγχει τον κέρσορα και πραγματοποιεί πλήρη περιήγηση, γράφει email και επικοινωνεί μέσω της φυσικής του φωνής.
Η ικανότητα της άμεσης, συνεχούς και αξιόπιστης επικοινωνίας του ανθρώπινου εγκεφάλου με εξωτερικές υπολογιστικές διατάξεις παύει οριστικά να αποτελεί απλώς ένα ερευνητικό πείραμα. Η ερευνητική ομάδα του UC Davis, σε συνεργασία με το Πανεπιστήμιο Brown και το ινστιτούτο Mass General Brigham, προχώρησε στη δημοσίευση των αποτελεσμάτων της κλινικής δοκιμής BrainGate2 στο έγκριτο επιστημονικό περιοδικό Nature Medicine. Η έρευνα καταγράφει τη μεγαλύτερη σε διάρκεια και σε όγκο δεδομένων αυτόνομη χρήση συστήματος Brain-Computer Interface (BCI) σε πραγματικές οικιακές συνθήκες, θέτοντας νέα τεχνολογικά πρότυπα για τις διεπαφές εγκεφάλου-μηχανής.
Πρωταγωνιστής της μελέτης είναι ο Casey Harrell, ένας 47χρονος ασθενής με αμυοτροφική πλευρική σκλήρυνση (ALS), ο οποίος πάσχει από βαριάς μορφής τετραπάρεση και δυσαρθρία. Μετά τη χειρουργική εμφύτευση της συσκευής το 2023, ο Harrell κατάφερε όχι απλώς να επικοινωνήσει ξανά, χρησιμοποιώντας μάλιστα τη φυσική του φωνή μέσω λογισμικού σύνθεσης, αλλά και να λειτουργήσει πλήρως έναν προσωπικό υπολογιστή χωρίς την παρουσία μηχανικών ή ιατρών στον χώρο του.
Πώς λειτουργεί το εμφύτευμα BCI του UC Davis
Το BCI αξιοποιεί τέσσερις συστοιχίες μικροηλεκτροδίων με 256 αισθητήρες, εμφυτευμένους στην αριστερή προκεντρική έλικα του εγκεφάλου. Διαβάζοντας τα νευρικά σήματα, προηγμένοι αλγόριθμοι τα μεταφράζουν σε κείμενο και συνθετική φωνή με ταχύτητα 56 λέξεων ανά λεπτό, προσφέροντας ακρίβεια 99% σε λεξιλόγιο 125.000 λέξεων, χωρίς καμία εξωτερική βοήθεια.
Το τεχνολογικό οικοδόμημα του συγκεκριμένου συστήματος στηρίζεται σε εξαιρετικά βελτιστοποιημένους αλγορίθμους αποκωδικοποίησης (decoding algorithms). Το σύστημα χωρίζεται σε δύο βασικούς λειτουργικούς πυλώνες: το "speech BCI", το οποίο αναλύει την πρόθεση παραγωγής φωνημάτων (φωνολογική αποκωδικοποίηση) για τη μετάφραση σε κείμενο ή ομιλία, και το "movement BCI", το οποίο αναλαμβάνει τον έλεγχο του ψηφιακού κέρσορα. Οι 256 αισθητήρες (cortical electrodes) καταγράφουν τα δυναμικά ενέργειας με ανάλυση σε επίπεδο μοναδιαίου νευρώνα στην περιοχή του εγκεφάλου που είναι αυστηρά επιφορτισμένη με τον συντονισμό των μυών της ομιλίας.
Όπως εξηγεί ο νευροχειρουργός David Brandman, συν-διευθυντής του Neuroprosthetics Lab στο UC Davis και επικεφαλής της μελέτης, η συστοιχία των μικροηλεκτροδίων συλλέγει ακατέργαστα νευρικά δεδομένα σε πραγματικό χρόνο. Στο παρελθόν, τα αντίστοιχα πειραματικά μοντέλα απαιτούσαν περίπλοκες ρυθμίσεις από τεχνικούς πριν από κάθε κύκλο χρήσης. Η νέα γενιά αλγορίθμων, εκπαιδευμένη μέσω προσεγγίσεων μηχανικής μάθησης, είναι ικανή να αντιληφθεί τις μικροαλλαγές στα νευρικά σήματα, οι οποίες συχνά προκύπτουν από την ελάχιστη μετακίνηση του αισθητήρα στον ιστό, και να προσαρμοστεί αυτόματα. Το αποτέλεσμα είναι η διατήρηση της δομικής εγκυρότητας της παραγόμενης επικοινωνίας ακόμα και όταν ο χρήστης προσπαθεί να αυξήσει δραματικά τον ρυθμό της ομιλίας του.
Η πραγματική χρήση στο σπίτι και τα ποσοστά επιτυχίας
Για πρώτη φορά, η τεχνολογία BCI δεν περιορίζεται σε αυστηρά ελεγχόμενα εργαστήρια. Ο ασθενής χρησιμοποίησε το σύστημα αυτόνομα στο σπίτι του για πάνω από 3.800 ώρες μέσα σε δύο χρόνια, επικοινωνώντας σχεδόν δύο εκατομμύρια λέξεις. Ο χειρισμός περιλαμβάνει σύνταξη email, περιήγηση στο διαδίκτυο και αναπαραγωγή της πραγματικής του φωνής μέσω υπολογιστή.
Τα στατιστικά νούμερα που προκύπτουν από τη μακροχρόνια χρήση του BCI από τον Harrell επαναπροσδιορίζουν τον κλάδο της βιοϊατρικής μηχανικής. Κατά τη διάρκεια της κλινικής δοκιμής, παρήγαγε περισσότερες από 183.000 προτάσεις, χρησιμοποιώντας το σύστημα σχεδόν καθημερινά. Η σταθερότητα του hardware σε συνδυασμό με την αξιοπιστία του λογισμικού, του επέτρεψε να είναι συνδεδεμένος και λειτουργικός για χρονικά διαστήματα που άγγιζαν τις 12 συνεχόμενες ώρες, υποστηρίζοντας την κοινωνική και επαγγελματική του ζωή.
Εξίσου εντυπωσιακό είναι το επίπεδο ακρίβειας. Ενώ προηγούμενες δοκιμές κατέγραφαν ακρίβεια 97% σε εξαιρετικά περιορισμένα λεξιλόγια (π.χ. 50 λέξεων), η συγκεκριμένη αρχιτεκτονική σημείωσε επιτυχία 99% σε ένα μοντέλο γλωσσικής επεξεργασίας που περιλαμβάνει 125.000 λέξεις. Οι ερευνητές μάλιστα τροφοδότησαν το σύστημα σύνθεσης ομιλίας με παλαιότερα ηχητικά δείγματα προ-διάγνωσης του Harrell, επιτρέποντας στον υπολογιστή να συνθέσει τη φωνή του.
Ανάλυση δεδομένων και η επόμενη μέρα των διεπαφών
Η επιτυχία της κλινικής δοκιμής BrainGate2 δημιουργεί ένα ισχυρό προηγούμενο για την ταχύτερη ανάπτυξη των συστημάτων BCI. Τα δεδομένα από τη συγκεκριμένη καταγραφή αποτελούν τη μεγαλύτερη βάση νευρικών σημάτων με ανάλυση μοναδιαίου νευρώνα παγκοσμίως, επιτρέποντας την εκπαίδευση βελτιωμένων αλγορίθμων για ασθενείς με νευρολογικές παθήσεις.
Η συγκέντρωση αυτού του τεράστιου όγκου (πάνω από 3.800 ώρες πραγματικής καταγραφής) συνιστά τον πολυτιμότερο ίσως πόρο για την παγκόσμια νευροεπιστημονική κοινότητα σήμερα. Ο Sergey Stavisky, νευρολόγος και συν-επικεφαλής της μελέτης, επισημαίνει πως η εξέταση ενός τόσο μεγάλου dataset επιτρέπει πλέον στους αλγορίθμους τεχνητής νοημοσύνης να χαρτογραφήσουν επακριβώς τη σύνδεση μεταξύ νευρικής δραστηριότητας και συγκεκριμένων φωνημάτων. Η εις βάθος κατανόηση της παραγωγής του λόγου στο φλοιό του εγκεφάλου δεν θα οδηγήσει απλώς σε καλύτερες ταχύτητες πληκτρολόγησης, αλλά θα αποτελέσει το θεμέλιο για τον σχεδιασμό μικρότερων, ασύρματων και λιγότερο επεμβατικών διατάξεων που θα απευθύνονται σε ευρύτερο φάσμα κινητικών δυσλειτουργιών.