Νέα αρχιτεκτονική νευρομορφικής όρασης αλλάζει τη Ρομποτική

Add as preferred source on Google

Σύνοψη

  • Ερευνητές ανέπτυξαν ένα νευρομορφικό chip 3 νανομέτρων (βασισμένο σε οξείδιο του ινδίου) που μιμείται τη λειτουργία του ανθρώπινου αμφιβληστροειδούς, συνδυάζοντας την ανίχνευση φωτός και τη μνήμη στην ίδια μονάδα.
  • Η νέα αρχιτεκτονική εκτελεί τους πολύπλοκους υπολογισμούς μηχανικής όρασης απευθείας στον αισθητήρα, καταργώντας την ανάγκη μεταφοράς δεδομένων στον κεντρικό επεξεργαστή.
  • Μειώνει δραματικά την κατανάλωση ενέργειας και εξαλείφει πλήρως τις καθυστερήσεις επικοινωνίας (latency), φέρνοντας επανάσταση στα συστήματα edge computing.
  • Η συγκεκριμένη τεχνολογία αποτελεί το επόμενο μεγάλο βήμα για τα αυτόνομα οχήματα, τα συστήματα βιομηχανικής ρομποτικής και το έξυπνο οικοσύστημα (IoT).

Η ραγδαία εξάπλωση των μοντέλων τεχνητής νοημοσύνης και η επιτακτική ανάγκη για προηγμένη μηχανική όραση αναδεικνύουν τα δομικά όρια των παραδοσιακών υπολογιστικών συστημάτων. Η συνεχής μεταφορά δεδομένων από τον συμβατικό αισθητήρα εικόνας (CMOS) στην κεντρική μονάδα επεξεργασίας και στη μνήμη (RAM) δημιουργεί σημαντικές καθυστερήσεις (latency) και απαιτεί τεράστια ποσά ενέργειας. 

Η νέα έρευνα εστιάζει στην in-sensor νευρομορφική πληροφορική. Χρησιμοποιώντας υπερλεπτά υλικά πάχους μόλις 3 νανομέτρων, οι επιστήμονες ανέπτυξαν ένα chip που αντιγράφει τη λειτουργία του ανθρώπινου αμφιβληστροειδούς, εκτελώντας την ανάλυση και αποθήκευση των οπτικών δεδομένων απευθείας στο σημείο λήψης τους.

Πώς λειτουργεί η In-Sensor Νευρομορφική Πληροφορική;

Η in-sensor νευρομορφική πληροφορική επιτρέπει στον ίδιο τον αισθητήρα εικόνας να συλλαμβάνει, να αποθηκεύει και να επεξεργάζεται τα οπτικά δεδομένα ταυτόχρονα. Το νέο chip βασίζεται σε ένα φιλμ οξειδίου του ινδίου με πάχος μόλις 3nm, το οποίο αξιοποιεί το φαινόμενο του μόνιμου φωτορεύματος για να λειτουργήσει ως τεχνητή σύναψη, εκμηδενίζοντας την ανάγκη μεταφοράς δεδομένων σε εξωτερικούς επεξεργαστές.

Στα συμβατικά συστήματα μηχανικής όρασης, η αρχιτεκτονική Von Neumann επιβάλλει τον αυστηρό διαχωρισμό μεταξύ της μονάδας λήψης, της μνήμης και του επεξεργαστή (CPU/NPU). Αυτό μεταφράζεται σε συνεχή διακίνηση gigabytes οπτικών δεδομένων, με αποτέλεσμα η ενέργεια που δαπανάται για τη μεταφορά της πληροφορίας μέσω των διαύλων να υπερβαίνει συχνά την ενέργεια που απαιτείται για τον ίδιο τον μαθηματικό υπολογισμό. Το νέο νευρομορφικό chip καταρρίπτει εξ ολοκλήρου αυτόν τον περιορισμό.

Η διάταξη εκμεταλλεύεται την οπτοηλεκτρονική συμπεριφορά του doped οξειδίου του ινδίου. Η έκθεση στο φως δεν παράγει απλώς ένα στιγμιαίο ηλεκτρικό σήμα, αλλά αλλάζει την αγωγιμότητα του υλικού για παρατεταμένο χρονικό διάστημα. Αυτή η φυσική ιδιότητα προσομοιώνει άριστα την συναπτική πλαστικότητα των βιολογικών νευρώνων, επιτρέποντας στο κύκλωμα να "θυμάται" και να μαθαίνει από τα οπτικά ερεθίσματα χωρίς καμία επέμβαση εξωτερικού λογισμικού ή συμβατικών μικροελεγκτών.

Το οξείδιο του Ινδίου και το φαινόμενο του μόνιμου φωτορεύματος

Το σημείο κλειδί της συγκεκριμένης αρχιτεκτονικής εντοπίζεται στη συμπεριφορά του "doped" οξειδίου του ινδίου. Οι ερευνητές ανέλυσαν διεξοδικά τον τρόπο με τον οποίο οι προσμίξεις στο υλικό καθορίζουν την αγωγιμότητά του υπό συνθήκες φωτισμού. Σε έναν τυπικό φωτοαισθητήρα, τα φωτόνια διεγείρουν τα ηλεκτρόνια, δημιουργώντας ηλεκτρικό ρεύμα που καταγράφεται ως ψηφιακή πληροφορία και κατόπιν μηδενίζεται άμεσα με τη διακοπή της φωτεινής πηγής. Αντιθέτως, στην in-sensor νευρομορφική πληροφορική, ο στόχος είναι η διατήρηση της πληροφορίας, λειτουργώντας πρακτικά ως η "μνήμη" του αμφιβληστροειδούς.

Εδώ ακριβώς παρεμβαίνει το φαινόμενο του μόνιμου φωτορεύματος. Ακόμα και όταν η πηγή του φωτός απενεργοποιείται, τα ηλεκτρόνια στο υλικό των 3 νανομέτρων παραμένουν σε διεγερμένη κατάσταση, αποθηκεύοντας ουσιαστικά την πληροφορία της αρχικής οπτικής έκθεσης. Ο βαθμός και η διάρκεια αυτής της διέγερσης ελέγχονται με εξαιρετική ακρίβεια, επιτρέποντας στους μηχανικούς να δημιουργήσουν ένα πυκνό δίκτυο "τεχνητών συνάψεων". Αυτές οι συνάψεις ενισχύονται ή αποδυναμώνονται ανάλογα με τα μοτίβα φωτός που δέχονται. Έτσι, το κύκλωμα εκτελεί τις πολύπλοκες πράξεις πολλαπλασιασμού και πρόσθεσης που απαιτούν τα νευρωνικά δίκτυα εντελώς παθητικά, σε αναλογικό επίπεδο, στο σημείο ακριβώς όπου καταγράφεται η οπτική πληροφορία.

Η σύγκριση με τα παραδοσιακά NPUs και CMOS

Η βιομηχανία ημιαγωγών μέχρι σήμερα επιχειρούσε να λύσει το πρόβλημα της αυξημένης επεξεργαστικής ανάγκης ενσωματώνοντας ειδικούς συνεπεξεργαστές (Μονάδες Νευρωνικής Επεξεργασίας - NPUs) δίπλα από τη CPU, ή αναπτύσσοντας ταχύτερους διαύλους δεδομένων. Αντίστοιχα, οι αισθητήρες CMOS έχουν εξελιχθεί ενσωματώνοντας μια στρώση μνήμης DRAM απευθείας κάτω από τα pixel (stacked sensors), βελτιώνοντας δραματικά την ταχύτητα ανάγνωσης των καρέ.

Παρ' όλα αυτά, το βασικό δομικό πρόβλημα παρέμενε ακέραιο: τα δεδομένα έπρεπε να μετατραπούν από αναλογικά (φως) σε ψηφιακά σήματα (0 και 1), να περάσουν στη μνήμη, να διαβαστούν από τον κεντρικό επεξεργαστή, να αναλυθούν μέσω του αλγορίθμου τεχνητής νοημοσύνης και στη συνέχεια να εξαχθεί το αποτέλεσμα. Η διαδικασία αυτή (analog-to-digital conversion) απαιτεί χιλιάδες κύκλους λειτουργίας.

Το νευρομορφικό chip καταργεί ολόκληρη αυτή την αλυσίδα μετατροπών, διαβάζει το φως, προσαρμόζει άμεσα την εσωτερική ηλεκτρική του κατάσταση και παράγει το τελικό συμπέρασμα σχεδόν ακαριαία, στην ίδια ακριβώς φυσική τοποθεσία. Πρόκειται για την απόλυτη μορφή hardware acceleration, η οποία δεν απαιτεί εκατομμύρια τρανζίστορς και ογκώδη συστήματα ψύξης.

Εφαρμογές στην αυτόνομη οδήγηση και τη Ρομποτική

Τα οφέλη της νευρομορφικής όρασης μεγιστοποιούνται σε περιβάλλοντα όπου οι κρίσιμες αποφάσεις πρέπει να λαμβάνονται ακαριαία, αλλά οι ενεργειακοί πόροι είναι εξαιρετικά περιορισμένοι. Στον τομέα των αυτόνομων οχημάτων (Επίπεδο 4 και 5), οι κάμερες υψηλής ανάλυσης παράγουν terabytes δεδομένων ανά ώρα. Η διαρκής αποστολή αυτών των ασυμπίεστων δεδομένων στο κεντρικό σύστημα του οχήματος (in-vehicle computer) δημιουργεί θερμικά φορτία και απαιτεί ιδιαίτερα βαριές μπαταρίες.

Με τη χρήση νευρομορφικών chips της τάξης των 3nm, οι αισθητήρες στις περιμετρικές κάμερες του οχήματος θα αναγνωρίζουν τα χωρικά μοτίβα (π.χ. πεζούς, σήματα κυκλοφορίας, εμπόδια στο δρόμο) τοπικά και αυτόνομα. Ο κεντρικός υπολογιστής του οχήματος θα λαμβάνει μόνο την τελική πληροφορία (τα metadata), μειώνοντας κατακόρυφα τον φόρτο εργασίας. Παράλληλα, τα συστήματα βιομηχανικής ρομποτικής, τα αυτόνομα drones αλλά και οι ιατρικές κάμερες εξειδικευμένης μικροχειρουργικής θα αποκτήσουν αυξημένη αυτονομία και ταχύτητα αντίδρασης, επιτρέποντας την εκτέλεση εργασιών ακριβείας.

Loading