Στην εποχή του TikTok και των βίντεο των 15 δευτερολέπτων, το να κάτσει κανείς να παρακολουθήσει ένα βίντεο διάρκειας μίας ώρας χωρίς σενάριο, χωρίς μουσική και χωρίς δράση, μοιάζει ακατόρθωτο. Κι όμως, αυτό το μονότονο βίντεο που δημοσίευσε η Figure AI είναι ίσως το πιο συναρπαστικό ντοκουμέντο τεχνολογικής προόδου που έχουμε δει φέτος.
Πρωταγωνιστής είναι το ανθρωποειδές ρομπότ Figure 02, το οποίο δεν κάνει τούμπες, ούτε χορεύει. Αντίθετα, κάνει κάτι πολύ πιο δύσκολο και σημαντικό: δουλεύει. Για 60 ολόκληρα λεπτά, χωρίς διακοπή, το ρομπότ ξεχωρίζει δέματα σε ένα περιβάλλον logistics, αποδεικνύοντας ότι η εποχή της πλήρους αυτονομίας δεν είναι επιστημονική φαντασία, αλλά μια απτή πραγματικότητα.
Η πρόκληση του «τσαλακωμένου φακέλου»
Για έναν άνθρωπο, η διαλογή δεμάτων είναι μια απλή, μηχανική διαδικασία. Για ένα ρομπότ, όμως, είναι ένας εφιάλτης υπολογισμών. Τα ρομπότ παραδοσιακά δυσκολεύονται με αντικείμενα που δεν έχουν σταθερό σχήμα. Ένα σκληρό κουτί είναι εύκολο. Μια πλαστική σακούλα (polybag) που ζαρώνει, γλιστράει και αλλάζει σχήμα όταν την πιάνεις; Αυτό απαιτεί τεράστια αντιληπτική ικανότητα.
Στο βίντεο, το Figure 02 φαίνεται να διαχειρίζεται με άνεση ακριβώς αυτά τα δύσκολα αντικείμενα: τσαλακωμένους φακέλους, μαλακές συσκευασίες και κιβώτια διαφορετικών μεγεθών. Χρησιμοποιεί τα δάχτυλά του με τρόπο που θυμίζει ανθρώπινη αφή, προσαρμόζοντας τη λαβή του σε πραγματικό χρόνο ανάλογα με το υλικό που αγγίζει.
Το «μυαλό» πίσω από την κίνηση: Helix Neural Network
Το μυστικό της επιτυχίας δεν βρίσκεται στα μεταλλικά μέρη του ρομπότ, αλλά στον εγκέφαλό του. Το Figure 02 λειτουργεί χάρη σε ένα προηγμένο νευρωνικό δίκτυο όρασης και γλώσσας, το οποίο η εταιρεία ονομάζει "Helix".
Σε αντίθεση με τα παλαιότερα ρομπότ που εκτελούσαν προγραμματισμένες κινήσεις, το Figure 02 «βλέπει» και «καταλαβαίνει». Η διαδικασία είναι πλήρως αυτόνομη. Οι κάμερες του ρομπότ στέλνουν δεδομένα στο νευρωνικό δίκτυο, το οποίο επεξεργάζεται την εικόνα και αποφασίζει πώς ακριβώς πρέπει να κινηθούν τα χέρια για να πιάσουν το αντικείμενο σωστά. Αν μια σακούλα γλιστρήσει λίγο, το ρομπότ το αντιλαμβάνεται και διορθώνει τη λαβή του ακαριαία, όπως θα έκανε ένας άνθρωπος εργάτης.
Γιατί η διάρκεια της μίας ώρας έχει σημασία;
Στον κόσμο της ρομποτικής, τα demos είναι συχνά παραπλανητικά. Βλέπουμε τα "best of", τα 10 δευτερόλεπτα που το ρομπότ πέτυχε το στόχο του, ενώ αγνοούμε τις 50 φορές που απέτυχε ή έπεσε κάτω.
Η απόφαση της Figure AI να δημοσιεύσει ένα βίντεο μίας ώρας χωρίς περικοπές είναι μια δήλωση αυτοπεποίθησης. Δείχνει στους επενδυτές και τις βιομηχανίες logistics ότι το σύστημά τους είναι:
- Αξιόπιστο: Δεν καταρρέει μετά από λίγα λεπτά.
- Σταθερό: Η απόδοση δεν πέφτει με την πάροδο του χρόνου.
- Αυτόνομο: Δεν υπάρχει άνθρωπος με χειριστήριο πίσω από την κουρτίνα.
Το μέλλον των Logistics
Η έλλειψη εργατικού δυναμικού στις αποθήκες και τα κέντρα διαλογής είναι παγκόσμιο φαινόμενο. Οι εργασίες αυτές είναι επαναλαμβανόμενες και σωματικά κουραστικές. Το Figure 02 έρχεται να καλύψει αυτό το κενό, όχι ως αντικαταστάτης της ανθρώπινης νοημοσύνης, αλλά ως η λύση για τη χειρωνακτική κόπωση.