Apertus: Αυτό είναι το open-source AI μοντέλο της Ελβετίας

Η παγκόσμια κούρσα για την ανάπτυξη ισχυρών μοντέλων Τεχνητής Νοημοσύνης αποκτά πλέον έναν απρόσμενο, αλλά αποφασισμένο παίκτη: ένα ολόκληρο κράτος. Η Ελβετία ανακοίνωσε την κυκλοφορία του Apertus, ενός εθνικού, ανοιχτού κώδικα Large Language Model (LLM), το οποίο φιλοδοξεί να αποτελέσει εναλλακτική στις λύσεις που προσφέρουν κολοσσοί όπως η OpenAI.

Το όνομα του μοντέλου, που στα λατινικά σημαίνει «ανοιχτός», δεν είναι τυχαίο. Δημιουργήθηκε από το Swiss Federal Technology Institute of Lausanne (EPFL), το ETH Zurich και το Swiss National Supercomputing Centre (CSCS), τρεις δημόσιους θεσμούς με βαρύ κύρος στην επιστημονική κοινότητα. Η πρωτοβουλία αυτή δεν παρουσιάζεται ως ένα ακόμη εμπορικό προϊόν, αλλά ως μια νέα μορφή δημόσιου αγαθού, όπως οι δρόμοι, το νερό ή η ηλεκτρική ενέργεια.

«Σήμερα, το Apertus είναι το κορυφαίο δημόσιο μοντέλο AI: φτιαγμένο από δημόσιους φορείς, για το δημόσιο συμφέρον», τόνισε ο Joshua Tan, ένας από τους πιο ένθερμους υποστηρικτές της ιδέας ότι η Τεχνητή Νοημοσύνη μπορεί να αποτελέσει δημόσια υποδομή. Σύμφωνα με τους δημιουργούς του, το Apertus είναι πλήρως ανοικτό και διαφανές. Όποιος το χρησιμοποιεί έχει τη δυνατότητα να εξετάσει κάθε στάδιο της εκπαίδευσής του, καθώς μαζί με το ίδιο το μοντέλο δημοσιεύτηκαν αναλυτική τεκμηρίωση, ο πηγαίος κώδικας και τα datasets που χρησιμοποιήθηκαν.

Η συμμόρφωση με το νομικό πλαίσιο της Ελβετίας για την προστασία δεδομένων και τα πνευματικά δικαιώματα ήταν βασικό κριτήριο σχεδιασμού. Αυτό το χαρακτηριστικό το καθιστά ιδιαίτερα ελκυστικό για εταιρείες που θέλουν να λειτουργούν εντός των αυστηρών ευρωπαϊκών κανονισμών. Η Swiss Bankers Association είχε επισημάνει εδώ και καιρό ότι ένα εγχώριο LLM θα μπορούσε να έχει «τεράστια μακροπρόθεσμη δυναμική», ακριβώς γιατί θα μπορεί να ανταποκρίνεται καλύτερα στους αυστηρούς κανόνες προστασίας προσωπικών δεδομένων και στο ελβετικό τραπεζικό απόρρητο.

Σε αντίθεση με άλλες εταιρείες που έχουν δεχθεί κριτική ή και μηνύσεις επειδή χρησιμοποίησαν περιεχόμενο χωρίς άδεια για την εκπαίδευση των μοντέλων τους, το Apertus εκπαιδεύτηκε αποκλειστικά σε δημόσια διαθέσιμα δεδομένα. Οι «crawlers» του σέβονταν κάθε αίτημα εξαίρεσης που ήταν καταχωρημένο με τρόπο αναγνώσιμο από μηχανές σε ιστότοπους. Με αυτό τον τρόπο, η Ελβετία επιδιώκει να τοποθετήσει το Apertus ως πρότυπο υπεύθυνης και ηθικής χρήσης δεδομένων στην τεχνολογική σκηνή.

Το νέο μοντέλο δεν προορίζεται μόνο για ακαδημαϊκούς ή ερευνητές. Οποιοσδήποτε –από ερασιτέχνες μέχρι εταιρείες– μπορεί να το αξιοποιήσει για να δημιουργήσει chatbots, μεταφραστικά εργαλεία ή ακόμη και εκπαιδευτικές εφαρμογές. Αυτό το στοιχείο ενισχύει την εικόνα του Apertus ως «κοινόχρηστου εργαλείου» που προσφέρει ίσες ευκαιρίες σε όσους θέλουν να πειραματιστούν ή να χτίσουν νέα προϊόντα πάνω σε αυτό.

Η εκπαίδευση του μοντέλου βασίστηκε σε 15 τρισεκατομμύρια tokens, καλύπτοντας περισσότερες από 1.000 γλώσσες. Εντυπωσιακό είναι ότι το 40% των δεδομένων προήλθε από γλώσσες εκτός της αγγλικής, συμπεριλαμβανομένων της ελβετικής γερμανικής και της Romansh, στοιχείο που ενισχύει την πολιτισμική ποικιλομορφία του εργαλείου.

Το Apertus κυκλοφορεί σε δύο εκδόσεις: μία με 8 δισεκατομμύρια παραμέτρους και μία πιο ισχυρή με 70 δισεκατομμύρια. Οι χρήστες μπορούν να έχουν πρόσβαση σε αυτό είτε μέσω της Swisscom, εταιρείας πληροφορικής και επικοινωνιών, είτε μέσω της πλατφόρμας Hugging Face, που αποτελεί σημείο αναφοράς για την κοινότητα της Τεχνητής Νοημοσύνης.

Αν και οι ελβετικές τράπεζες και άλλοι οργανισμοί ήδη χρησιμοποιούν υπάρχοντα μοντέλα AI, μένει να φανεί αν θα στραφούν στο Apertus. Ωστόσο, το γεγονός ότι το νέο μοντέλο έχει δημιουργηθεί αποκλειστικά από δημόσιους φορείς και με γνώμονα τη διαφάνεια του προσδίδει σημαντικό πλεονέκτημα, ειδικά σε έναν κόσμο όπου οι ανησυχίες για την ιδιωτικότητα και τη νομιμότητα των δεδομένων εντείνονται.

Η κίνηση αυτή της Ελβετίας υποδηλώνει μια νέα αντίληψη για τον ρόλο της Τεχνητής Νοημοσύνης: όχι μόνο ως τεχνολογικό προϊόν που ανήκει σε ιδιωτικές εταιρείες, αλλά και ως δημόσια υποδομή στην υπηρεσία της κοινωνίας.

[via]

Loading