Google Deepmind: Η νέα AI προσέγγιση στην «εσωτερική φωνή» των ρομπότ

Μια ιδιαίτερα πρωτοποριακή προσέγγιση εξετάζει η ερευνητική ομάδα της Google DeepMind στον τομέα της ρομποτικής: την ανάπτυξη ενός είδους εσωτερικού μονολόγου για τα ρομπότ, που θα μπορούσε να οδηγήσει σε σημαντικά άλματα στην κατανόηση και την αυτονομία των μηχανών. Η ιδέα, η οποία περιγράφεται αναλυτικά σε πρόσφατο δίπλωμα ευρεσιτεχνίας, επιδιώκει να βελτιώσει δραστικά τον τρόπο με τον οποίο τα ρομπότ αλληλεπιδρούν με το περιβάλλον τους.

Η τεχνολογία, με την ονομασία "intra-agent speech to facilitate homework learning", δεν έχει σκοπό να κάνει τα ρομπότ φιλοσοφικά όντα που μονολογούν ακατάπαυστα. Αντίθετα, πρόκειται για έναν λειτουργικό και εξαιρετικά αποδοτικό μηχανισμό μάθησης, που επιτρέπει στο ρομπότ να παρατηρεί ανθρώπινες ενέργειες και να δημιουργεί εσωτερικές περιγραφές σε φυσική γλώσσα για ό,τι βλέπει. Για παράδειγμα, όταν το ρομπότ βλέπει κάποιον να πιάνει ένα φλιτζάνι, μπορεί να διατυπώσει εσωτερικά τη φράση «το άτομο παίρνει το φλιτζάνι».

Η διαδικασία αυτή λειτουργεί σαν γέφυρα ανάμεσα στην οπτική πληροφορία και την εννοιολογική κατανόηση. Αντί να διαχειρίζεται απλώς ακατέργαστα δεδομένα από αισθητήρες, το ρομπότ αναγνωρίζει το νόημα πίσω από την εικόνα και σχηματίζει ένα «νοητικό» μοντέλο της δράσης που παρατηρεί. Έτσι, ενισχύεται η ικανότητά του να αντιλαμβάνεται, να προβλέπει και να αναπαράγει πολύπλοκες ενέργειες με βάση την κατανόηση και όχι απλώς τη μίμηση.

Μια από τις πιο εντυπωσιακές συνέπειες αυτής της μεθόδου είναι η δυνατότητα εκμάθησης χωρίς προηγούμενη εμπειρία – αυτό που οι ειδικοί αποκαλούν "zero-shot learning". Με άλλα λόγια, το ρομπότ μπορεί να εκτελέσει μια ενέργεια που δεν του έχει προηγουμένως διδαχθεί ρητά. Αν, για παράδειγμα, έχει μάθει τι σημαίνει «παίρνω» μέσα από την εμπειρία με ένα φλιτζάνι, μπορεί να εφαρμόσει την ίδια αρχή για να πιάσει μια μπάλα ή οποιοδήποτε άλλο άγνωστο αντικείμενο. Αυτού του είδους η γενίκευση πλησιάζει την ανθρώπινη λογική και καθιστά τα ρομπότ σημαντικά πιο ευέλικτα.

Παράλληλα, η Google DeepMind υποστηρίζει ότι αυτή η τεχνική μπορεί να μειώσει τις απαιτήσεις σε υπολογιστική ισχύ και μνήμη – παράγοντες που μέχρι σήμερα αποτελούν σοβαρό εμπόδιο στην ευρύτερη χρήση πολύπλοκων ρομποτικών συστημάτων. Η δημιουργία εσωτερικών περιγραφών βοηθά το ρομπότ να οργανώνει τις πληροφορίες του με πιο αποτελεσματικό τρόπο, μειώνοντας την ανάγκη για εκτεταμένη επεξεργασία δεδομένων.

Η έρευνα αυτή εντάσσεται σε ένα ευρύτερο πλάνο της Google να καταστήσει τη ρομποτική πιο ανεξάρτητη και λειτουργική σε πραγματικές συνθήκες. Ενδεικτικό παράδειγμα είναι το πρόσφατο έργο με τίτλο "Gemini Robotics On-Device", ένα μικρό αλλά αποδοτικό μοντέλο τεχνητής νοημοσύνης σχεδιασμένο να λειτουργεί τοπικά, μέσα στο ίδιο το ρομπότ, χωρίς την ανάγκη διαρκούς σύνδεσης με το cloud. Αυτή η αυτονομία είναι καθοριστική για περιβάλλοντα όπου η συνδεσιμότητα είναι περιορισμένη, όπως για παράδειγμα στην υγειονομική περίθαλψη ή σε απομακρυσμένες περιοχές.

Η προσθήκη μιας «εσωτερικής φωνής» σε τέτοια ρομπότ ενισχύει περαιτέρω την ικανότητά τους να λαμβάνουν αποφάσεις βασισμένες στο πλαίσιο και να προσαρμόζονται σε δυναμικά και απρόβλεπτα σενάρια. Σε αντίθεση με παλαιότερες γενιές ρομπότ που λειτουργούσαν με βάση αυστηρά προγραμματισμένες εντολές, οι νέες προσεγγίσεις φέρνουν τις μηχανές ένα βήμα πιο κοντά στη φυσική νοημοσύνη.

Η Google DeepMind, μέσα από αυτή την προσπάθεια, επιχειρεί να ανοίξει νέους δρόμους στη ρομποτική, μετατρέποντας τα ρομπότ από απλούς εκτελεστές εντολών σε οντότητες που μπορούν να κατανοούν, να μαθαίνουν και να προσαρμόζονται. Και όσο φιλόδοξη κι αν ακούγεται η ιδέα ενός ρομπότ που «σκέφτεται» φωναχτά, φαίνεται πως πλησιάζει περισσότερο την πραγματικότητα απ’ ό,τι φανταζόμασταν.

[via]

Loading