Atlas: Το ρομπότ που μαθαίνει να κινείται σαν άνθρωπος με ένα μόνο μοντέλο AI

Ο Atlas, το ανθρωποειδές ρομπότ της Boston Dynamics που έγινε διάσημο για τις εντυπωσιακές φιγούρες παρκούρ και τα χορευτικά του βίντεο, κάνει πλέον ένα βήμα πιο κοντά σε αυτό που πολλοί θεωρούν το μέλλον της ρομποτικής. Για πρώτη φορά, το ρομπότ καταφέρνει να περπατά και να πιάνει αντικείμενα αξιοποιώντας ένα και μόνο μοντέλο τεχνητής νοημοσύνης, μια εξέλιξη που ενδέχεται να ανοίξει τον δρόμο προς τα ρομπότ γενικής χρήσης.

Η μεγάλη καινοτομία βρίσκεται στη χρήση ενός ενιαίου μοντέλου μάθησης που ελέγχει ταυτόχρονα τα χέρια και τα πόδια του ρομπότ. Παραδοσιακά, οι ρομποτικές πλατφόρμες χρειάζονταν διαφορετικά συστήματα για κάθε είδος κίνησης: ένα για το περπάτημα ή το άλμα και ένα άλλο για τη λαβή και τον χειρισμό αντικειμένων. Αυτή η προσέγγιση, όμως, περιορίζει τη φυσικότητα των κινήσεων και συχνά απαιτεί πολύπλοκη συνεργασία ανάμεσα σε πολλά επιμέρους συστήματα.

Σε συνεργασία με το Toyota Research Institute (TRI), η Boston Dynamics παρουσίασε έναν πιο «γενικευμένο» αλγόριθμο, ο οποίος εκπαιδεύεται σε ένα σύνολο παραδειγμάτων από διαφορετικές κινήσεις. Όπως εξήγησε ο Russ Tedrake, επικεφαλής ερευνητής στο TRI και καθηγητής στο MIT, η λογική του νέου συστήματος αντιμετωπίζει τα πόδια ως «επιπλέον χέρια» που μπορούν να προσαρμοστούν ανάλογα με τις απαιτήσεις της κίνησης. Το πιο εντυπωσιακό, όπως τόνισε, είναι ότι αυτό «απλά λειτουργεί».

Η λειτουργία του Atlas βασίζεται σε μια ποικιλία δεδομένων. Το μοντέλο τροφοδοτείται με εικόνες από τις κάμερες του ρομπότ, πληροφορίες από αισθητήρες που ανιχνεύουν τη θέση και την κίνηση του σώματός του, καθώς και λεκτικά σήματα που συνδέονται με συγκεκριμένες ενέργειες. Η εκπαίδευση γίνεται με ένα μείγμα μεθόδων: τηλεχειρισμό, προσομοιώσεις και βίντεο επίδειξης. Το αποτέλεσμα είναι ένα «μεγάλο μοντέλο συμπεριφοράς» (Large Behavior Model – LBM) που ελέγχει το ρομπότ με έναν τρόπο πιο κοντά στις φυσικές, ανθρώπινες κινήσεις.

Ένα χαρακτηριστικό παράδειγμα είναι η διαδικασία ανύψωσης αντικειμένων από ένα δοχείο. Αντί να λειτουργεί μηχανικά, το Atlas χρησιμοποιεί τα πόδια του για να επαναφέρει την ισορροπία του, όπως θα έκανε και ένας άνθρωπος που σκύβει. Ακόμα πιο αξιοσημείωτη είναι η εμφάνιση «αναδυόμενων» δεξιοτήτων: όταν το ρομπότ αφήνει κατά λάθος ένα αντικείμενο να πέσει, δείχνει την ικανότητα να σκύψει και να το ξανασηκώσει, παρότι δεν έχει εκπαιδευτεί ειδικά σε αυτό.

Η εξέλιξη αυτή έχει ιδιαίτερη σημασία για τον χώρο της ρομποτικής. Όπως τα μεγάλα γλωσσικά μοντέλα (LLMs) αποκτούν απροσδόκητες δεξιότητες, όπως η ικανότητα να γράφουν κώδικα, έτσι και τα LBM υπόσχονται ρομπότ που θα εμφανίζουν νέες, μη προγραμματισμένες ικανότητες στην προσπάθειά τους να εκτελέσουν μια εργασία. Η ιδέα ότι ένα ρομπότ μπορεί να αναπτύξει δεξιότητες που δεν του έχουν «δειχθεί» ευθέως, αποτελεί ίσως το πρώτο βήμα προς πιο ευέλικτες, «έξυπνες» μηχανές.

Σύμφωνα με τον Tedrake, η πρόοδος που σημειώνεται δείχνει ότι τα ρομπότ αρχίζουν να αναπτύσσουν πιο γενικευμένες μορφές μάθησης. Στο εργαστήριό του, πειραματίζονται ήδη με διαφορετικούς τύπους ρομποτικών βραχιόνων, οι οποίοι εκπαιδεύονται σε ποικιλία καθημερινών εργασιών: από το κόψιμο λαχανικών μέχρι τον καθαρισμό κόκκων καφέ που έχουν χυθεί στον πάγκο.

Η σύγκλιση αυτών των προσπαθειών δημιουργεί την προοπτική ενός μέλλοντος όπου τα ρομπότ δεν θα περιορίζονται σε εξειδικευμένα καθήκοντα, αλλά θα μπορούν να προσαρμόζονται σε νέες καταστάσεις με μεγαλύτερη ευκολία. Αντί για μια συλλογή από «σκληρά προγραμματισμένες» κινήσεις, θα διαθέτουν την ικανότητα να αυτοσχεδιάζουν και να μαθαίνουν συνεχώς, πλησιάζοντας ολοένα και περισσότερο την ανθρώπινη ευελιξία.

[via]

Loading