Όταν ο χρόνος μετράει κυριολεκτικά σε δευτερόλεπτα, όπως σε αποστολές διάσωσης ή κρίσιμες επιχειρήσεις. η ταχύτητα της τεχνολογίας μπορεί να καθορίσει τη διαφορά ανάμεσα στη ζωή και στον θάνατο. Μια ερευνητική ομάδα του MIT ανέπτυξε ένα νέο σύστημα τεχνητής νοημοσύνης που υπόσχεται να αλλάξει τους κανόνες του παιχνιδιού: μια μέθοδο που επιτρέπει τη δημιουργία λεπτομερών τρισδιάστατων χαρτών σχεδόν στιγμιαία. Το επίτευγμα ανοίγει τον δρόμο για ρομπότ που μπορούν να προσανατολίζονται αυτόνομα ακόμη και στα πιο χαοτικά περιβάλλοντα.
Πίσω από το έργο βρίσκεται η ομάδα του καθηγητή Luca Carlone, με τον διδακτορικό φοιτητή Dominic Maggio και τον ερευνητή Hyungtae Lim. Το σύστημά τους στηρίζεται σε μια υβριδική προσέγγιση που συνδυάζει την ακρίβεια της γεωμετρίας με την προσαρμοστικότητα της μηχανικής μάθησης. Ο θεμέλιος λίθος είναι η γνωστή τεχνική SLAM (Simultaneous Localization and Mapping), η οποία επιτρέπει σε ρομπότ και αυτόνομα οχήματα να χαρτογραφούν τον χώρο γύρω τους ενώ ταυτόχρονα υπολογίζουν τη θέση τους σε αυτόν.
Ωστόσο, οι υπάρχουσες εφαρμογές του SLAM έχουν σημαντικούς περιορισμούς. Οι παραδοσιακές, γεωμετρικές μέθοδοι δυσκολεύονται να λειτουργήσουν σε περιβάλλοντα γεμάτα εμπόδια ή έντονη κίνηση, ενώ τα μοντέλα που βασίζονται αποκλειστικά στη μηχανική μάθηση «κολλάνε» όταν ο όγκος των εικόνων υπερβαίνει τις περίπου εξήντα ταυτόχρονες λήψεις. Με απλά λόγια, είτε η ταχύτητα είτε η ακρίβεια έπρεπε πάντα να θυσιαστεί.
Η καινοτομία του MIT βρίσκεται στη λύση αυτού ακριβώς του διλήμματος. Οι ερευνητές χώρισαν τον χώρο σε μικρότερες ενότητες. Κάθε υπο-χάρτης λειτουργεί αυτόνομα, αλλά το σύστημα τους ευθυγραμμίζει σταδιακά, συνθέτοντας έτσι έναν ενιαίο, συνεκτικό τρισδιάστατο χάρτη του περιβάλλοντος. Το αποτέλεσμα είναι εντυπωσιακό: η μέθοδος μπορεί να διαχειριστεί πρακτικά απεριόριστο αριθμό εικόνων χωρίς να χάνει την ακρίβεια του υπολογισμού θέσης σε πραγματικό χρόνο.
Το επόμενο βήμα ήταν η σύνθεση των δύο κόσμων, της γεωμετρικής ακρίβειας και της τεχνητής νοημοσύνης, σε ένα κοινό σύστημα. Με τον τρόπο αυτό, οι ερευνητές κατάφεραν να διορθώσουν τις παραμορφώσεις που συχνά δημιουργούνται όταν πολλοί υπο-χάρτες προσπαθούν να «κουμπώσουν» μεταξύ τους. Αυτή η σύζευξη μαθηματικής δομής και υπολογιστικής μάθησης αποδείχθηκε το μυστικό για τη δραματική αύξηση τόσο της ταχύτητας όσο και της ακρίβειας.
Οι δοκιμές έδειξαν ότι το νέο σύστημα ξεπερνά κάθε υπάρχουσα μέθοδο χαρτογράφησης, χωρίς να απαιτεί εξειδικευμένο εξοπλισμό ή προσαρμοσμένες κάμερες. Σε μια εντυπωσιακή επίδειξη, οι ερευνητές χρησιμοποίησαν ένα απλό βίντεο τραβηγμένο με smartphone στο εσωτερικό του MIT Chapel. Το σύστημα κατάφερε να ανακατασκευάσει ολόκληρο το περιβάλλον σε τρεις διαστάσεις με απόκλιση μικρότερη από πέντε εκατοστά. Η ακρίβεια αυτή, επιτευγμένη με τόσο απλά μέσα, δείχνει πόσο ραγδαία προχωρά η σύγκλιση μεταξύ AI και ρομποτικής μηχανικής.
Οι επιπτώσεις αυτής της εξέλιξης ξεπερνούν κατά πολύ το πεδίο των επιχειρήσεων διάσωσης. Σύμφωνα με τους ερευνητές, η ίδια τεχνολογία θα μπορούσε να αξιοποιηθεί σε εφαρμογές επαυξημένης και εικονικής πραγματικότητας (AR/VR), στην αυτοματοποίηση βιομηχανικών διαδικασιών, αλλά και στη χρήση drones για αποστολές επιθεώρησης ή μεταφορών. Για παράδειγμα, ένα headset επαυξημένης πραγματικότητας θα μπορούσε να δημιουργεί άμεσα έναν τρισδιάστατο χάρτη του χώρου γύρω από τον χρήστη, βελτιώνοντας την ακρίβεια της αλληλεπίδρασης με ψηφιακά αντικείμενα.
Σε επίπεδο ρομποτικής, η ικανότητα ενός μηχανήματος να αναγνωρίζει τον χώρο του και να αντιδρά σε πραγματικό χρόνο ανοίγει εντελώς νέους ορίζοντες. Σκεφτείτε ρομπότ-διασώστες που κινούνται σε ερείπια μετά από σεισμούς, drones που χαρτογραφούν επικίνδυνες περιοχές χωρίς ανθρώπινη παρουσία ή αυτόνομα οχήματα που προσαρμόζονται δυναμικά σε αστικά περιβάλλοντα γεμάτα μεταβαλλόμενα δεδομένα. Όλα αυτά γίνονται πιο εφικτά όταν η χαρτογράφηση δεν είναι πια εμπόδιο, αλλά σχεδόν στιγμιαία διαδικασία.
Για τον Carlone, το κλειδί της επιτυχίας βρίσκεται στην κατανόηση των θεμελιωδών μηχανισμών πίσω από το ίδιο το μοντέλο. Όπως δήλωσε, «όταν κατανοείς πραγματικά τι συμβαίνει μέσα στο σύστημα, μπορείς να πετύχεις λύσεις πιο κλιμακούμενες και πιο ακριβείς». Η φράση του συνοψίζει το πνεύμα της έρευνας: η πρόοδος στην τεχνητή νοημοσύνη δεν εξαρτάται μόνο από την αύξηση της υπολογιστικής ισχύος, αλλά και από την απλότητα του σχεδιασμού.
Η παρουσίαση του έργου έχει ήδη προγραμματιστεί για το συνέδριο NeurIPS (Conference on Neural Information Processing Systems), ένα από τα σημαντικότερα γεγονότα παγκοσμίως στον χώρο της τεχνητής νοημοσύνης.
[source]