Τα έντομα εμπνέουν μια νέα AI που «βλέπει» και «ακούει» όπως ο άνθρωπος

Μια ερευνητική ομάδα από το University of Liverpool ανέπτυξε ένα πρωτοποριακό μοντέλο τεχνητής νοημοσύνης που συνδυάζει ήχους και εικόνες με τρόπο παρόμοιο με τον ανθρώπινο εγκέφαλο. Εμπνευσμένο από τον τρόπο που τα έντομα επεξεργάζονται τα ερεθίσματα του περιβάλλοντος τους, το νέο αυτό σύστημα υπόσχεται να φέρει τις μηχανές ένα βήμα πιο κοντά σε μια φυσική, «ανθρώπινη» αντίληψη του κόσμου.

Στο επίκεντρο βρίσκεται μια νευρολογική λειτουργία που εντοπίστηκε αρχικά στα έντομα και στη συνέχεια προσαρμόστηκε από τον ψυχολόγο Cesare Parise, ώστε να επεξεργάζεται πραγματικά οπτικοακουστικά σήματα – όπως ταινίες ή ηχητικά αποσπάσματα – αντί για αφηρημένα δεδομένα. Ο Parise και η ομάδα του κατάφεραν να μετατρέψουν αυτή τη βιολογική αρχή σε έναν υπολογιστικό μηχανισμό που μιμείται τον τρόπο με τον οποίο ο εγκέφαλος συνδυάζει ό,τι βλέπουμε και ακούμε.

Για παράδειγμα, όταν παρακολουθούμε κάποιον να μιλά, ο εγκέφαλός μας συγχρονίζει αυτόματα τις κινήσεις των χειλιών με τον ήχο της φωνής του. Είναι η ίδια διεργασία που εξηγεί φαινόμενα όπως το φαινόμενο McGurk, όπου η ασυμφωνία ανάμεσα στο ηχητικό και το οπτικό ερέθισμα δημιουργεί μια νέα, ψευδή αντίληψη, ή την ψευδαίσθηση του κοιλιακού ομιλητή, όταν η φωνή μοιάζει να προέρχεται από την κούκλα. Αυτές οι καθημερινές εμπειρίες υποδηλώνουν τη βαθιά και ακριβή συνεργασία ανάμεσα στις αισθήσεις μας, κάτι που η επιστήμη προσπαθεί να αναπαραγάγει στους υπολογιστές εδώ και δεκαετίες.

Μέχρι τώρα, τα περισσότερα υπολογιστικά μοντέλα αδυνατούσαν να χειριστούν πραγματικά δεδομένα εικόνας και ήχου ταυτόχρονα. Ο Parise εξηγεί ότι τα θεωρητικά μοντέλα μπορεί να είχαν επιστημονική αξία, αλλά δεν μπορούσαν να λειτουργήσουν με πραγματικά ερεθίσματα. Για να ξεπεράσει αυτόν τον περιορισμό, σχεδίασε ένα δίκτυο «ανιχνευτών συσχέτισης», τοποθετημένων σε ένα οπτικοακουστικό πλέγμα. Οι ανιχνευτές αυτοί καταγράφουν σχέσεις μεταξύ ήχου και εικόνας τόσο στον χρόνο όσο και στον χώρο, επιτρέποντας στο σύστημα να κατανοεί πότε και πώς τα δύο συνδέονται.

Αυτό το νέο μοντέλο, γνωστό ως Multisensory Correlation Detector (MCD), είναι το αποτέλεσμα πολυετούς συνεργασίας με τον Marc Ernst από το Bielefeld University. Η αρχή λειτουργίας του μιμείται τους βιολογικούς μηχανισμούς που επιτρέπουν στους οργανισμούς να συνδυάζουν πληροφορίες από διαφορετικές αισθήσεις, δημιουργώντας μια ενιαία αντίληψη του περιβάλλοντος.

Για να δοκιμαστεί η αξιοπιστία του MCD, οι ερευνητές το υπέβαλαν σε 69 πειράματα που έχουν διεξαχθεί στο παρελθόν σε ανθρώπους, πιθήκους και αρουραίους. Το αποτέλεσμα ήταν εντυπωσιακό: το μοντέλο όχι μόνο αναπαρήγαγε με ακρίβεια τα αποτελέσματα αυτών των μελετών, αλλά το έκανε με λιγότερες παραμέτρους και χαμηλότερη υπολογιστική ισχύ σε σχέση με το βασικό ανταγωνιστικό μοντέλο στον χώρο, το Bayesian causal inference model. Πρόκειται για τη μεγαλύτερη προσομοίωση που έχει πραγματοποιηθεί ποτέ στο πεδίο της πολυαισθητηριακής αντίληψης.

Ακόμη πιο ενδιαφέρον είναι το γεγονός ότι, χάρη στην απλότητά του, το MCD μπορεί να προβλέψει ποια σημεία μιας οπτικοακουστικής σκηνής θα τραβήξουν την προσοχή του ανθρώπινου βλέμματος, λειτουργώντας ουσιαστικά ως ένα «μοντέλο εστίασης» που εκτιμά τι προκαλεί το ενδιαφέρον μας.

Σε αντίθεση με τα σημερινά μοντέλα τεχνητής νοημοσύνης, τα οποία απαιτούν τεράστιες ποσότητες επισημασμένων δεδομένων και πολύπλοκη εκπαίδευση, το MCD δεν χρειάζεται καμία εκπαίδευση για να λειτουργήσει. Επεξεργάζεται απευθείας τα πραγματικά οπτικοακουστικά ερεθίσματα, όπως ακριβώς ο εγκέφαλος. Αυτή η προσέγγιση όχι μόνο μειώνει δραστικά το υπολογιστικό κόστος, αλλά ανοίγει τον δρόμο για πιο φυσικές, ευέλικτες και προσαρμοστικές μορφές τεχνητής νοημοσύνης.

Οι εφαρμογές ενός τέτοιου συστήματος είναι εκτεταμένες: από τη ρομποτική και τα αυτόνομα οχήματα, μέχρι συστήματα περιβαλλοντικής αντίληψης ή υπολογιστές που αλληλεπιδρούν με τον άνθρωπο με μεγαλύτερη ακρίβεια. Σε όλους αυτούς τους τομείς, η ικανότητα να συνδυάζεται η «όραση» και η «ακοή» με ανθρώπινη φυσικότητα είναι καθοριστική.

Το έργο των Parise και Ernst δείχνει για ακόμη μια φορά ότι η φύση συχνά κατέχει τα πιο αποδοτικά σχέδια — αρκεί να ξέρουμε πώς να τα μιμηθούμε. Η μελέτη του εγκεφάλου των εντόμων, με τις απλές αλλά εξαιρετικά αποτελεσματικές λειτουργίες του, ίσως αποδειχθεί το κλειδί για την ανάπτυξη μηχανών που δεν «υπολογίζουν» απλώς τον κόσμο, αλλά τον αντιλαμβάνονται.

[source]