Παγκόσμια πρωτιά: Η AI αποκωδικοποιεί πλέον την ομιλία καλύτερα και από ανθρώπους - ειδικούς

Για πρώτη φορά, ερευνητές απέδειξαν ότι τα γλωσσικά μοντέλα μπορούν να αναλύσουν την ανθρώπινη ομιλία με την ίδια ακρίβεια και ενίοτε μεγαλύτερη διορατικότητα που διαθέτουν οι άνθρωποι εμπειρογνώμονες. Η εξέλιξη αυτή δεν αποτελεί απλώς ένα τεχνολογικό επίτευγμα, αλλά ανοίγει ένα νέο κεφάλαιο στην κατανόηση και διάγνωση ψυχιατρικών διαταραχών, όπως η σχιζοφρένια.

Η ανατροπή στα δεδομένα της Γλωσσικής Ανάλυσης

Μέχρι πρότινος, η ανάλυση της ανθρώπινης γλώσσας για τον εντοπισμό λεπτών νοητικών διαταραχών θεωρούνταν αποκλειστικό προνόμιο των εξειδικευμένων κλινικών ιατρών. Η ικανότητα να διακρίνει κανείς την «ασυνάρτητη» ροή του λόγου ή τα «κενά» στη σκέψη ενός ασθενούς απαιτούσε χρόνια εκπαίδευσης και ανθρώπινη διαίσθηση. Ωστόσο, μια πρωτοποριακή μελέτη από το University College του Λονδίνου (UCL) και το Πανεπιστήμιο της Οξφόρδης έρχεται να αμφισβητήσει αυτό το δόγμα.

Οι ερευνητές χρησιμοποίησαν προηγμένα γλωσσικά μοντέλα (LLMs) για να εξετάσουν τον τρόπο ομιλίας ατόμων με σχιζοφρένια και συνέκριναν τα αποτελέσματα με εκείνα υγιών εθελοντών. Το πόρισμα ήταν εντυπωσιακό: η AI κατάφερε να εντοπίσει μοτίβα και αποκλίσεις στη «σημασιολογική συνοχή» (semantic coherence) με ακρίβεια που συναγωνίζεται εκείνη των κορυφαίων ειδικών ψυχικής υγείας.

Το «Δακτυλικό Αποτύπωμα» της σκέψης

Στο επίκεντρο της έρευνας βρίσκεται η έννοια της προβλεψιμότητας. Όταν μιλάμε, ο εγκέφαλός μας ανασύρει λέξεις και έννοιες που συνδέονται λογικά μεταξύ τους, δημιουργώντας μια αλυσίδα νοήματος. Στην περίπτωση της σχιζοφρένειας, αυτή η αλυσίδα συχνά παρουσιάζει ρωγμές. Οι λέξεις μοιάζουν αποσυνδεδεμένες και η ροή της σκέψης γίνεται λιγότερο προβλέψιμη.

Στο πείραμα, ζητήθηκε από 26 ασθενείς με σχιζοφρένια και 26 άτομα της ομάδας ελέγχου να ολοκληρώσουν απλές εργασίες «λεκτικής ευχέρειας», όπως το να ονομάσουν όσα περισσότερα ζώα μπορούσαν ή λέξεις που ξεκινούν από το γράμμα «Π» μέσα σε πέντε λεπτά.

Εδώ παρενέβη η Τεχνητή Νοημοσύνη. Το μοντέλο, εκπαιδευμένο σε τεράστιους όγκους κειμένων από το διαδίκτυο ώστε να κατανοεί πώς συνδέονται οι λέξεις μεταξύ τους, ανέλυσε τις απαντήσεις. Διαπίστωσε ότι οι απαντήσεις των ασθενών με σχιζοφρένια ήταν πολύ λιγότερο «προβλέψιμες» για το μοντέλο σε σχέση με αυτές των υγιών συμμετεχόντων. Το πιο σημαντικό; Η AI μπορούσε να ποσοτικοποιήσει αυτή τη διαφορά με μαθηματική ακρίβεια, προσφέροντας έναν αντικειμενικό δείκτη που μέχρι σήμερα έλειπε από την ψυχιατρική εργαλειοθήκη.

Πέρα από την ανθρώπινη διαίσθηση

Το γεγονός ότι ένα εργαλείο AI μπορεί να «καταλάβει» πότε ο λόγος χάνει τη συνοχή του είναι επαναστατικό. Παραδοσιακά, η διάγνωση ψυχιατρικών νόσων βασίζεται σε συνεντεύξεις και στην υποκειμενική κρίση του γιατρού. Αν και οι ειδικοί είναι εξαιρετικά ικανοί, η κόπωση ή η προκατάληψη μπορούν να επηρεάσουν την κρίση τους.

Η μελέτη έδειξε ότι τα γλωσσικά μοντέλα μπορούν να λειτουργήσουν ως ένας αμερόληπτος, ακούραστος παρατηρητής. Συνδυάζοντας τα αποτελέσματα της AI με απεικονίσεις εγκεφάλου (χρησιμοποιώντας μαγνητοεγκεφαλογραφία - MEG), οι επιστήμονες κατάφεραν μάλιστα να συνδέσουν τη «χαοτική» ομιλία με συγκεκριμένα μοτίβα εγκεφαλικής δραστηριότητας σε περιοχές που σχετίζονται με τη μνήμη και τη δημιουργία νοητικών χαρτών.

Ουσιαστικά, η AI δεν άκουγε απλώς λέξεις· «αποκωδικοποιούσε» τον τρόπο με τον οποίο ο εγκέφαλος οργανώνει τις αναμνήσεις και τις ιδέες.

Το μέλλον της Ψυχιατρικής και η AI

Τα ευρήματα αυτά, που δημοσιεύτηκαν στο έγκριτο επιστημονικό περιοδικό Proceedings of the National Academy of Sciences (PNAS), υποδηλώνουν ότι βρισκόμαστε στην αυγή μιας νέας εποχής για την «Ψηφιακή Ψυχιατρική». Φανταστείτε ένα μέλλον όπου μια απλή ανάλυση ομιλίας μέσω μιας εφαρμογής στο κινητό θα μπορούσε να προειδοποιήσει για την έναρξη ενός ψυχωσικού επεισοδίου ή να παρακολουθεί την αποτελεσματικότητα μιας φαρμακευτικής αγωγής σε πραγματικό χρόνο.

Η τεχνολογία αυτή δεν έρχεται να αντικαταστήσει τον ψυχίατρο, αλλά να τον εξοπλίσει με έναν υπερ-αισθητήρα. Όπως ο καρδιολόγος χρησιμοποιεί το ηλεκτροκαρδιογράφημα για να δει πράγματα που δεν ακούγονται με το στηθοσκόπιο, έτσι και ο ειδικός ψυχικής υγείας θα μπορεί να χρησιμοποιεί τα γλωσσικά μοντέλα για να εντοπίζει αλλαγές στη δομή της σκέψης που είναι αόρατες στο γυμνό «αυτί».