OpenELM: Η Apple λανσάρει 8 open-source AI μοντέλα που λειτουργούν απευθείας στη συσκευή
Η Apple κυκλοφόρησε μια σειρά από διάφορα νέα μοντέλα AI που έχουν σχεδιαστεί για να εκτελούνται τοπικά στη συσκευή και όχι στο cloud, ανοίγοντας ενδεχομένως το δρόμο για ένα iOS 18 με AI στο όχι πολύ μακρινό μέλλον.
Η σουίτα εργαλείων AI περιέχει οκτώ διαφορετικά μοντέλα, τα οποία ονομάζονται OpenELMs (Open-source Efficient Language Models). Όπως υποδηλώνει το όνομα, τα μοντέλα αυτά είναι πλήρως ανοιχτού κώδικα και διατίθενται στο Hugging Face Hub, μια διαδικτυακή κοινότητα για προγραμματιστές και λάτρεις της Τεχνητής Νοημοσύνης. Η Apple δημοσίευσε επίσης ένα whitepaper που περιγράφει τα νέα μοντέλα. Τέσσερα έχουν προ-εκπαιδευτεί στο CoreNet (προηγουμένως CVNets), μια τεράστια βιβλιοθήκη δεδομένων που χρησιμοποιείται για την εκπαίδευση γλωσσικών μοντέλων AI, ενώ τα άλλα τέσσερα έχουν «συντονιστεί» με οδηγίες από την Apple, μια διαδικασία με την οποία οι παράμετροι εκμάθησης ενός μοντέλου AI βελτιώνονται προσεκτικά ώστε να ανταποκρίνονται σε συγκεκριμένες προτροπές.
Τα μοντέλα OpenELM της Apple έχουν τέσσερα μεγέθη (270 εκατομμύρια, 450 εκατομμύρια, 1,1 δισεκατομμύρια και 3 δισεκατομμύρια παραμέτρους), καθένα από τα οποία είναι μικρότερο από πολλά μοντέλα υψηλών επιδόσεων εκεί έξω (συνήθως έχουν περίπου 7 δισεκατομμύρια παραμέτρους) και καθένα από τα οποία διατίθεται σε προ-εκπαιδευμένη και καθοδηγούμενη έκδοση.
Η διανομή λογισµικού open-source είναι μια κάπως ασυνήθιστη κίνηση για την Apple, η οποία συνήθως συγκρατεί αρκετά στενά το οικοσύστημα του λογισμικού της. Η εταιρεία ισχυρίζεται ότι θέλει να «ενδυναμώσει και να εμπλουτίσει» τη δημόσια έρευνα Τεχνητής Νοημοσύνης με την απελευθέρωση των OpenELMs στην ευρύτερη κοινότητα. Τα μοντέλα προ-εκπαιδεύτηκαν σε δημόσια σύνολα δεδομένων 1,8 τρισεκατομμυρίων tokens από το Reddit, τη Wikipedia, το arXiv.org και άλλα.
Η Apple έχει αφοσιωθεί σοβαρά στην Τεχνητή Νοημοσύνη τον τελευταίο καιρό, κάτι που είναι καλό να βλέπουμε, καθώς ο ανταγωνισμός είναι έντονος τόσο στο χώρο των smartphones όσο και των laptops, με τεχνολογία όπως το AI-powered Tensor chip του Google Pixel 8 και το τελευταίο AI chip της Qualcomm που έρχεται στις συσκευές Surface.
Εκθέτοντας τα νέα της on-device AI μοντέλα στον κόσμο με αυτόν τον τρόπο, η Apple πιθανότατα ελπίζει ότι κάποιοι φιλόδοξοι developers θα βοηθήσουν να εξομαλυνθούν οι ατέλειες και τελικά να βελτιωθεί το λογισμικό - κάτι που θα μπορούσε να αποδειχθεί ζωτικής σημασίας αν σχεδιάζει να εφαρμόσει νέα τοπικά εργαλεία AI σε μελλοντικές εκδόσεις του iOS και του macOS.
Αξίζει να έχουμε κατά νου ότι η μέση συσκευή της Apple είναι ήδη γεμάτη με δυνατότητες AI, με την Apple Neural Engine που βρίσκεται στα chips A- και M-series της εταιρείας να τροφοδοτεί χαρακτηριστικά όπως το Face ID και το Animoji. Το επερχόμενο M4 chip για τα συστήματα Mac φαίνεται επίσης να διαθέτει νέες δυνατότητες επεξεργασίας που σχετίζονται με την Τεχνητή Νοημοσύνη, κάτι που γίνεται γρήγορα αναγκαία καθώς όλο και πιο διαδεδομένα επαγγελματικά λογισμικά εφαρμόζουν εργαλεία μηχανικής μάθησης (όπως το Firefly στο Adobe Photoshop).
[via]