Ιστορική πρωτιά: Δορυφόρος με AI της Google βρίσκει στόχους μόνος του

Σύνοψη

Για πρώτη φορά, ο δορυφόρος Yam-9 της Loft Orbital αναγνώρισε αυτόνομα επίγειους στόχους σε πραγματικό χρόνο χωρίς καμία ανθρώπινη παρέμβαση.
Η υποδομή βασίζεται στο λογισμικό NAVI-Orbital του Jet Propulsion Laboratory (JPL) της NASA και στο μοντέλο Gemma 3 Vision-Language Model (VLM) της Google DeepMind.
Η επεξεργασία εκτελείται τοπικά στο διάστημα μέσω του επεξεργαστή NVIDIA Jetson Orin AGX, καταργώντας την ανάγκη μετάδοσης Terabytes ακατέργαστων δεδομένων στη Γη.
Η τεχνολογία επιτρέπει τον έλεγχο δορυφόρων με εντολές σε φυσική γλώσσα (π.χ. «παρακολούθησε αυτά τα σύνορα») και μειώνει το latency από ώρες σε δευτερόλεπτα.

Η βιομηχανία της διαστημικής τεχνολογίας πέτυχε ένα ιστορικό ορόσημο που μεταβάλλει ριζικά τον τρόπο συλλογής, επεξεργασίας και αξιοποίησης των δεδομένων γεωσκόπησης. Για πρώτη φορά στα χρονικά, ένας δορυφόρος παρατήρησης της Γης κατάφερε να εντοπίσει και να κατηγοριοποιήσει συγκεκριμένους στόχους στην επιφάνεια του πλανήτη με απόλυτη αυτονομία, χωρίς να απαιτείται ανθρώπινη καθοδήγηση ή η παραδοσιακή, χρονοβόρα αποστολή των ακατέργαστων εικόνων σε επίγειους σταθμούς.

Το επίτευγμα ανήκει στην εταιρεία παροχής διαστημικής υποδομής Loft Orbital και πραγματοποιήθηκε στο διαστημικό της όχημα Yam-9. Η επιτυχία της αποστολής βασίζεται στην πρώτη καταγεγραμμένη ενσωμάτωση και λειτουργία ενός Μοντέλου Όρασης και Γλώσσας (Vision-Language Model - VLM) απευθείας στο εσωτερικό ενός δορυφόρου, ανοίγοντας τον δρόμο για τη δημιουργία αυτόνομων δικτύων επιτήρησης σε χαμηλή γήινη τροχιά (LEO).

Η αρχιτεκτονική του Space Edge Computing και η συνεργασία NASA και Google

Μέχρι σήμερα, η λειτουργία των δορυφόρων γεωσκόπησης ακολουθούσε μια παθητική και γραμμική διαδικασία. Οι αισθητήρες κατέγραφαν τεράστιους όγκους οπτικών δεδομένων ή δεδομένων ραντάρ (SAR), τα οποία αποθηκεύονταν τοπικά και μεταδίδονταν στη Γη κατά τη διάρκεια των σύντομων παραθύρων επικοινωνίας με τους επίγειους σταθμούς. Εκεί, εξειδικευμένοι αναλυτές ή επίγειοι αλγόριθμοι αναλάμβαναν να επεξεργαστούν τα Terabytes των δεδομένων, να φιλτράρουν τις λήψεις που καλύπτονταν από σύννεφα και να εντοπίσουν τα στοιχεία ενδιαφέροντος. Η διαδικασία αυτή απαιτούσε από αρκετές ώρες έως ημέρες, καθιστώντας αδύνατη την άμεση αντίδραση σε κρίσιμα γεγονότα.

Ο δορυφόρος Yam-9 ανέτρεψε αυτή την πρακτική μεταφέροντας την υπολογιστική ισχύ (Edge Computing) απευθείας στο Διάστημα. Το διαστημικό σκάφος εκτελεί το πακέτο λογισμικού NAVI-Orbital, το οποίο αναπτύχθηκε από το Jet Propulsion Laboratory (JPL) της NASA. Το συγκεκριμένο λογισμικό φιλοξενεί το Gemma 3, το προηγμένο Vision-Language Model της Google DeepMind. Το Gemma 3 έχει σχεδιαστεί ειδικά για edge εφαρμογές, προσφέροντας τη δυνατότητα να συνδυάζει την κειμενική λογική των μεγάλων γλωσσικών μοντέλων με την ανάλυση εικόνας, λειτουργώντας αποτελεσματικά σε περιβάλλοντα με περιορισμένους hardware πόρους.

Για την εκτέλεση αυτών των απαιτητικών αλγορίθμων, ο Yam-9 είναι εξοπλισμένος με τον επεξεργαστή NVIDIA Jetson Orin AGX GPU, ο οποίος αποτελεί ένα από τα κορυφαία chips επεξεργασίας για διαστημικές εφαρμογές. Οι μηχανικοί της NASA και του JPL κατάφεραν να απλοποιήσουν και να βελτιστοποιήσουν το μοντέλο Gemma 3, ώστε να λειτουργεί εντός των αυστηρών περιορισμών μνήμημης, διαχείρισης ενέργειας και θερμικής αντοχής που επιβάλλει η παραμονή σε τροχιά.

Εντολές σε φυσική γλώσσα και άμεση αντιμετώπιση του Bandwidth Bottleneck

Στις δοκιμές που πραγματοποιήθηκαν, η AI του δορυφόρου κλήθηκε να ανταποκριθεί σε σύνθετα ερωτήματα και να κατηγοριοποιήσει δεδομένα αισθητήρων σε πραγματικό χρόνο. Οι ερευνητές ζήτησαν από το μοντέλο να εντοπίσει τα όρια μεταξύ φυσικού περιβάλλοντος και ανθρώπινης δραστηριότητας, καθώς και να αναγνωρίσει υποδομές κοντά σε σιδηροδρομικούς κόμβους. Το Gemma 3 επεξεργάστηκε τις εικόνες τοπικά και απέδωσε τα αποτελέσματα ακαριαία.

Η εξέλιξη αυτή λύνει το μεγαλύτερο πρόβλημα της δορυφορικής βιομηχανίας: το σημείο συμφόρησης του εύρους ζώνης (bandwidth bottleneck). Αντί οι επίγειες ομάδες να περιμένουν τη λήψη τεράστιων αρχείων, ο δορυφόρος στέλνει πλέον μόνο μεταδεδομένα (metadata), δηλαδή τις συντεταγμένες, το είδος του αντικειμένου και το ποσοστό επιβεβαίωσης του αλγορίθμου. Όπως δήλωσε ο Paul Lasserre, επικεφαλής του τμήματος AI της Loft Orbital, η τεχνολογία αυτή επιτρέπει τη δημιουργία μόνιμων στρωμάτων περιπολίας στο διάστημα (always-on, patrol layers). Οι χρήστες θα μπορούν να δίνουν οδηγίες στον δορυφόρο χρησιμοποιώντας απλή, φυσική γλώσσα, όπως: «Παρακολούθησε αυτά τα σύνορα και ενημέρωσέ με αν εντοπίσεις κάτι ύποπτο».

Ο ανταγωνισμός και το μέλλον των έξυπνων αστερισμών

Η Loft Orbital, η οποία διαχειρίζεται αυτή τη στιγμή 12 διαστημικά σκάφη, σχεδιάζει να επεκτείνει τον αστερισμό της στους 50 με 100 δορυφόρους τύπου Yam-9, ώστε να εξασφαλίσει την κάλυψη οποιουδήποτε σημείου του πλανήτη σε πραγματικό χρόνο.

Η εταιρεία δεν είναι η μόνη που επενδύει σε αυτή την κατεύθυνση. Η Planet Labs χρησιμοποιεί ήδη επεξεργαστές Jetson Orin στους δικούς της δορυφόρους για απλές μορφές ανίχνευσης αντικειμένων και επιβεβαίωσε ότι διεξάγει έρευνα για την ενσωμάτωση VLMs. Παράλληλα, η Kepler Communications εργάζεται εντατικά για την αύξηση της υπολογιστικής ισχύος σε τροχιά.

Η αρχική ιδέα για το πρότζεκτ NAVI-Orbital ξεκίνησε από τον ερευνητή του JPL, Taran Cyriac John, ο οποίος οραματίστηκε ένα ψηφιακό βοηθό για αστροναύτες που θα εξερευνούν τη Σελήνη ή τον Άρη. Καθώς οι αστροναύτες σε στολές υπό πίεση δεν μπορούν να χρησιμοποιήσουν πληκτρολόγιο, η επικοινωνία με ένα AI μέσω φωνής και φυσικής γλώσσας για την ανάλυση του γύρω περιβάλλοντος κρίνεται απαραίτητη.

Με τη ματιά του Techgear

Η επιτυχής δοκιμή της Loft Orbital και της NASA αποδεικνύει ότι το μέλλον της διαστημικής παρατήρησης δεν κρίνεται πλέον στην ανάλυση των καμερών, αλλά στην υπολογιστική ισχύ του ίδιου του δορυφόρου. Η μετατροπή των διαστημικών οχημάτων από παθητικούς συλλέκτες εικόνων σε αυτόνομους κόμβους λήψης αποφάσεων μειώνει δραματικά το latency και το κόστος διαχείρισης δεδομένων.

Για την ελληνική πραγματικότητα, η τεχνολογία αυτή έχει άμεση και κρίσιμη εφαρμογή. Ένας αντίστοιχος αστερισμός μικροδορυφόρων με Edge AI θα μπορούσε να επιτηρεί το Αιγαίο για τον εντοπισμό πλοίων με απενεργοποιημένα συστήματα AIS ή να σκανάρει τους δασικούς όγκους της χώρας κατά τη διάρκεια του καλοκαιριού. Αντί να περιμένουμε τη λήψη εικόνων από ξένους παρόχους μετά από ώρες, η AI θα έστελνε τις ακριβείς συντεταγμένες μιας νέας εστίας πυρκαγιάς στην Πολιτική Προστασία μέσα σε 90 δευτερόλεπτα από τη στιγμή της ανάφλεξης.