Καθώς πλησιάζει το Παγκόσμιο Συνέδριο Προγραμματιστών της Apple (WWDC) 2025, συμπληρώνεται ένας χρόνος από την παρουσίαση του Apple Intelligence. Ωστόσο, παρά τις αρχικές προσδοκίες, μέχρι στιγμής οι εξελίξεις είναι μάλλον απογοητευτικές. Η εμπειρία που προσφέρουν τα AI εργαλεία της Apple απέχει σημαντικά από τις δυνατότητες που ήδη προσφέρουν πλατφόρμες όπως το ChatGPT ή το Gemini.
Αν και πριν ένα χρόνο οι αναλυτές περίμεναν κάποιες καθυστερήσεις, λίγοι φαντάζονταν ότι η πραγματικά «έξυπνη Siri», το μεγάλο στοίχημα της Apple για προσωποποιημένη αλληλεπίδραση με τις συσκευές, θα παρέμενε εκτός παιχνιδιού. Η λειτουργία αυτή, που υπόσχεται να μάθει από τα δεδομένα του iPhone και να ελέγχει εφαρμογές, τελικά δεν κυκλοφόρησε ποτέ.
Ωστόσο, η Apple φαίνεται αποφασισμένη να καλύψει το χαμένο έδαφος. Το φετινό WWDC αναμένεται να παρουσιάσει τη δεύτερη γενιά του Apple Intelligence με νέες δυνατότητες που πιθανότατα θα ενσωματωθούν στο iOS 19, iPadOS 19 και macOS 16. Μέχρι τότε, υπάρχει τουλάχιστον μια σημαντική και πολλά υποσχόμενη εξέλιξη στον τομέα της τεχνητής νοημοσύνης από την Apple: το ερευνητικό μοντέλο Matrix3D.
Πρόκειται για ένα καινοτόμο σύστημα τεχνητής νοημοσύνης που μπορεί να δημιουργεί τρισδιάστατες σκηνές χρησιμοποιώντας μόλις τρεις φωτογραφίες ενός αντικειμένου. Το Matrix3D αναπτύχθηκε από την Apple σε συνεργασία με ερευνητές από το Πανεπιστήμιο Ναντζίνγκ και το Πολυτεχνείο του Χονγκ Κονγκ. Η δημοσίευση των ευρημάτων και του αντίστοιχου κώδικα στο GitHub αποδεικνύει τη διαφάνεια της έρευνας, αλλά εγείρει ερωτήματα σχετικά με το πότε και αν θα ενσωματωθεί η τεχνολογία αυτή στα καταναλωτικά προϊόντα της Apple.
Η λειτουργία του Matrix3D βασίζεται στην ανάλυση τριών φωτογραφιών από διαφορετικές γωνίες, τις οποίες το σύστημα επεξεργάζεται ώστε να κατανοήσει το βάθος, τη θέση της κάμερας και τα χαρακτηριστικά του αντικειμένου. Στη συνέχεια, παράγει νέες γωνίες θέασης, δίνοντας στον χρήστη μια ρεαλιστική τρισδιάστατη απεικόνιση. Τα δείγματα που έχουν δημοσιευτεί εντυπωσιάζουν με την ποιότητά τους, μοιάζοντας με βίντεο τραβηγμένα από πραγματική κάμερα.
Η εκπαίδευση του Matrix3D πραγματοποιήθηκε με τη χρήση δεκάδων εκατομμυρίων εικόνων και «frames βάθους» από έξι δημόσια datasets, επιτρέποντας στο σύστημα να μάθει να ανακατασκευάζει 3D σκηνές ακόμα και με περιορισμένες πληροφορίες.
Το μεγάλο ερώτημα είναι αν και πότε αυτή η τεχνολογία θα βρει εφαρμογή στην καθημερινή εμπειρία των χρηστών iPhone. Η Apple έχει ήδη κάνει βήματα στον τομέα της τρισδιάστατης απεικόνισης, προσφέροντας δυνατότητες όπως τα Spatial Photos που είναι ιδανικά για θέαση στο Vision Pro. Το Matrix3D θα μπορούσε να εξελίξει αυτή την εμπειρία, προσφέροντας στους χρήστες τη δυνατότητα να μετατρέπουν απλές φωτογραφίες σε 3D μοντέλα ή να δημιουργούν εναλλακτικές οπτικές γωνίες με τη βοήθεια AI.
Επιπλέον, η τεχνολογία αυτή θα μπορούσε να φέρει επανάσταση και στον χώρο του εμπορίου. Φανταστείτε εφαρμογές αγορών όπου ο χρήστης μπορεί να δει ένα έπιπλο από όλες τις πλευρές πριν το αγοράσει, ή εργαλεία για προγραμματιστές που δημιουργούν περιεχόμενο για εικονική και επαυξημένη πραγματικότητα με λιγότερους πόρους και χρόνο.
Παρά τα πολλά υποσχόμενα σενάρια, η Apple δεν έχει ακόμη ανακοινώσει επίσημα αν σκοπεύει να ενσωματώσει το Matrix3D στις πλατφόρμες της. Το παρελθόν έχει δείξει πως η εταιρεία συχνά δημοσιεύει εντυπωσιακές έρευνες χωρίς να τις μεταφράζει άμεσα σε εμπορικές εφαρμογές, μια στρατηγική που θυμίζει τις πολυάριθμες πατέντες iPhone που τελικά δεν βλέπουν ποτέ το φως της παραγωγής.
[via]