Το μηχανικό χέρι της OpenAI έμαθε να λύνει μόνο του τον κύβο του Ρούμπικ

Η OpenAI κουράστηκε να ξεφτιλίζει τους ανθρώπους στο DoTA 2 και επιστρέφει στο προσκήνιο με ένα ρομποτικό χέρι που έχει καταφέρει να…αυτοεκπαιδευτεί και να λύνει πλέον τον κλασικό κύβο του Ρούμπικ. Το ρομποτικό χέρι ονομάζεται Dactyl και εκπαιδεύτηκε με τη χρήση δύο νευρωνικών δικτύων σε συνδυασμό με τη νέα τεχνική ADR (Automatic Domain Randomization) και αλγόριθμο ενισχυμένης εκμάθησης.

Η νέα τεχνική ADR θεωρείται πολύ σημαντική διότι είναι αυτή που ωθεί το Dactyl στη λύση του κύβου του Ρούμπικ, δημιουργώντας συνεχώς νέα σενάρια αυξανόμενης δυσκολίας. Ξεκινά με ένα απλό περιβάλλον που δεν έχει δημιουργηθεί τυχαία και εκεί το νευρωνικό δίκτυο μαθαίνει να λύνει πρόβλημα. Όσο βελτιώνεται το νευρωνικό δίκτυο και φτάνει σε ένα κρίσιμο σημείο απόδοσης, τότε αυτόματα αυξάνεται το ποσοστό “τυχαιότητας” του περιβάλλοντος. Αυτό δυσκολεύει σημαντικά τη δουλειά για το νευρωνικό δίκτυο, μιας και καλείται να βρει τη λύση σε ένα μη - προκαθορισμένο περιβάλλον. Αφότου λύσει εκ νέου το πρόβλημα, η διαδικασία επαναλαμβάνεται με μεγαλύτερη δυσκολία κ.ο.κ. Επομένως, το Dactyl αναγκάζεται να εκπαιδεύσει τον εαυτό του για την επίλυση δυσκολότερων προβλημάτων.

Η ερευνητικό ομάδα θεωρεί την τεχνική ADR ένα πολύ σημαντικό επίτευγμα, καθώς πλέον δεν χρειάζεται να έχουν ένα ακριβές μοντέλο του πραγματικού κόσμου και τους επιτρέπει να χρησιμοποιήσουν αυτά τα νευρωνικά δίκτυα σε πληθώρα εφαρμογών στην πραγματική ζωή.

Το επίτευγμα της επίλυσης του κύβου του Ρούμπικ από ένα ρομποτικό χέρι, θεωρείται πολύ σημαντικό για την επιστημονική κοινότητα. Όπως δήλωσε ο κ. Dmitry Berenson από το University of Michigan,

Είναι ένα πραγματικά πολύ δύσκολο πρόβλημα. Το επίπεδο της διαχείρισης που απαιτείται για να περιστρέψεις μεμονωμένα κομμάτια του κύβου είναι τρομερά πιο απαιτητικό σε σύγκριση με μια απλή μετακίνηση αντικειμένου

Από την πλευρά της, η κ. Leslie Kaelbling, καθηγήτρια Ρομποτικής στο MIT σημειώνει:

Είμαι εντυπωσιασμένη. Είναι κάτι που δεν θα φανταζόμουν ποτέ ότι θα καταφέρουν να επιτύχουν

Οι ερευνητές του OpenAI πιστεύουν ότι έχουν στα χέρια τους μια ισχυρή απόδειξη ότι στο μέλλον θα υπάρχουν ρομπότ γενικής χρήσης που θα μπορούν να προσαρμοστούν σε πληθώρα διαφορετικών συνθηκών, καθότι θα εκπαιδεύονται από μόνα τους με παρόμοιο τρόπο.

Loading