Από τη στιγμή που κοιτάμε μια εικόνα ενός αγνώστου περιβάλλοντος – είτε πρόκειται για ένα ορεινό μονοπάτι, έναν πολυσύχναστο δρόμο ή μια λίμνη – μπορούμε ακαριαία να αντιληφθούμε τι μπορούμε να κάνουμε μέσα σε αυτό. Θα περπατήσουμε; Μπορούμε να ποδηλατήσουμε ή να κολυμπήσουμε; Ή ίσως το περιβάλλον δεν μας επιτρέπει να προχωρήσουμε καθόλου. Αν και φαίνεται αυτονόητο, αυτή η ικανότητα του εγκεφάλου μας να εκτιμά άμεσα τις πιθανές δράσεις δεν είναι καθόλου απλή.
Μια πρόσφατη μελέτη από τον Clemens Bartnik, υποψήφιο διδάκτορα, και την ερευνητική ομάδα της Iris Groen, έρχεται να φωτίσει αυτό ακριβώς το φαινόμενο. Η έρευνα αποκαλύπτει πώς συγκεκριμένα μοτίβα στον ανθρώπινο εγκέφαλο μας επιτρέπουν να αναγνωρίζουμε ενστικτωδώς τις δυνατότητες δράσης σε ένα περιβάλλον, μια ικανότητα που οι πιο προηγμένοι αλγόριθμοι τεχνητής νοημοσύνης, ακόμη δυσκολεύονται να αναπαραγάγουν.
Η μελέτη πραγματοποιήθηκε με τη χρήση απεικόνισης μαγνητικού συντονισμού (MRI), κατά τη διάρκεια της οποίας συμμετέχοντες κλήθηκαν να παρατηρήσουν φωτογραφίες από εσωτερικούς και εξωτερικούς χώρους. Οι εθελοντές έπρεπε να απαντήσουν, πατώντας ένα κουμπί, αν η σκηνή τους προέτρεπε να περπατήσουν, να οδηγήσουν, να ποδηλατήσουν, να κολυμπήσουν, να πλεύσουν ή να σκαρφαλώσουν. Την ίδια στιγμή, οι ερευνητές κατέγραφαν τη νευρική τους δραστηριότητα.
«Αναρωτηθήκαμε: όταν βλέπει κανείς ένα περιβάλλον, βλέπει μόνο τα αντικείμενα και τα χρώματα ή αντιλαμβάνεται και τις δυνατότητες δράσης που προσφέρει;» εξηγεί η Groen. Στη γλώσσα της ψυχολογίας, αυτές οι δυνατότητες ονομάζονται “affordances” – όρο που περιγράφει το τι μπορεί κανείς να κάνει σε ένα συγκεκριμένο περιβάλλον, όπως να ανεβεί σκάλες ή να τρέξει σε έναν ανοιχτό αγρό.
Τα αποτελέσματα αποκάλυψαν κάτι εντυπωσιακό: συγκεκριμένες περιοχές του οπτικού φλοιού ενεργοποιούνταν με τρόπο που δεν μπορούσε να εξηγηθεί απλώς από τα αντικείμενα της εικόνας. Δηλαδή, ο εγκέφαλος δεν κατέγραφε μόνο το τι έβλεπε, αλλά και το τι μπορούσε να κάνει με αυτό που έβλεπε. Και το πιο ενδιαφέρον; Αυτή η επεξεργασία γινόταν αυτόματα, ακόμα κι όταν οι συμμετέχοντες δεν είχαν λάβει οδηγίες να σκεφτούν τη δράση τους. Όπως σημειώνει η Groen, αυτό δείχνει πως η δυνατότητα να αντιλαμβανόμαστε τις «ευκαιρίες δράσης» είναι βαθιά ενσωματωμένη στον τρόπο που ο εγκέφαλός μας επεξεργάζεται τον κόσμο.
Παράλληλα, οι ερευνητές συνέκριναν αυτή την ανθρώπινη ικανότητα με τις επιδόσεις σύγχρονων συστημάτων τεχνητής νοημοσύνης, μεταξύ αυτών και το GPT-4. Τα αποτελέσματα έδειξαν ξεκάθαρα πως τα μοντέλα τεχνητής νοημοσύνης δεν τα πήγαν το ίδιο καλά. Ακόμα και όταν εκπαιδεύτηκαν ειδικά για την αναγνώριση πιθανών δράσεων σε εικόνες, οι υπολογισμοί τους δεν ταυτίζονταν με τα μοτίβα του ανθρώπινου εγκεφάλου.
«Ακόμα και τα πιο εξελιγμένα μοντέλα δεν δίνουν τις ίδιες απαντήσεις με τους ανθρώπους, παρόλο που πρόκειται για κάτι που για εμάς είναι σχεδόν αυτονόητο», αναφέρει η Groen. Αυτό, όπως εξηγεί, οφείλεται στο ότι η ανθρώπινη αντίληψη συνδέεται στενά με τη φυσική μας εμπειρία στον κόσμο. Αντίθετα, τα συστήματα τεχνητής νοημοσύνης λειτουργούν σε έναν καθαρά ψηφιακό χώρο, χωρίς πρόσβαση σε πραγματικές αλληλεπιδράσεις.
Η μελέτη ανοίγει έτσι τον δρόμο για μια βαθύτερη συζήτηση σχετικά με την ανάπτυξη πιο ευφυών και αποδοτικών συστημάτων τεχνητής νοημοσύνης. Σε εφαρμογές όπως η ρομποτική ή η αυτόνομη οδήγηση, η ικανότητα να αναγνωρίζεις όχι μόνο τι υπάρχει σε ένα περιβάλλον αλλά και τι μπορεί να γίνει σε αυτό, είναι κρίσιμη. Ένα ρομπότ σε περιοχή καταστροφής ή ένα αυτόνομο όχημα πρέπει να καταλαβαίνει αν αυτό που βλέπει είναι μονοπάτι ή δρόμος – και να αντιδρά αναλόγως.
Η Groen τονίζει επίσης τη σημασία αυτής της γνώσης για την ανάπτυξη πιο βιώσιμων τεχνολογιών. Οι σημερινές μέθοδοι εκπαίδευσης της τεχνητής νοημοσύνης απαιτούν τεράστια ποσά ενέργειας και είναι συχνά προσβάσιμες μόνο σε μεγάλες εταιρείες τεχνολογίας. Η μελέτη της λειτουργίας του ανθρώπινου εγκεφάλου μπορεί να προσφέρει ένα νέο μοντέλο για το πώς μπορούμε να αναπτύξουμε πιο αποδοτικά, έξυπνα και ανθρώπινα συμβατά συστήματα.
[via]