Google DeepMind: Τα 5 βασικά επίπεδα για τη Γενική Τεχνητή Νοημοσύνη (AGI)

Σύνοψη

Η Google DeepMind εισάγει ένα νέο, μετρήσιμο πλαίσιο για την κατηγοριοποίηση της Τεχνητής Γενικής Νοημοσύνης (AGI).
Απορρίπτεται η δυαδική προσέγγιση (AGI vs μη-AGI) και υιοθετείται μια κλίμακα πέντε επιπέδων: Emerging, Competent, Expert, Virtuoso και Superhuman.
Η αξιολόγηση εστιάζει αποκλειστικά στις ικανότητες (τι μπορεί να κάνει το μοντέλο) και όχι στους εσωτερικούς μηχανισμούς λειτουργίας του.
Παράλληλα με τα επίπεδα απόδοσης, το πλαίσιο εξετάζει τα επίπεδα αυτονομίας, καθορίζοντας τον βαθμό ανθρώπινης παρέμβασης που απαιτείται.
Στόχος είναι η δημιουργία μιας κοινής, επιστημονικής γλώσσας για την ασφαλή ανάπτυξη και μέτρηση των μελλοντικών AI συστημάτων.

Τι είναι το νέο πλαίσιο αξιολόγησης AGI της Google DeepMind;

Η Google DeepMind εισάγει ένα κλιμακωτό πλαίσιο πέντε επιπέδων για την αξιολόγηση της Τεχνητής Γενικής Νοημοσύνης (AGI). Το σύστημα αξιολογεί τα μοντέλα με βάση την απόδοση και την αυτονομία τους σε ένα ευρύ φάσμα γνωστικών εργασιών, αντικαθιστώντας φιλοσοφικά ερωτήματα με αυστηρά, μετρήσιμα κριτήρια απόδοσης έναντι των ανθρώπινων ικανοτήτων.

Η συζήτηση γύρω από την Τεχνητή Γενική Νοημοσύνη ταλαιπωρείται εδώ και δεκαετίες από ασαφείς ορισμούς. Οι ερευνητές παραδοσιακά διαφωνούν για το πότε μια μηχανή φτάνει στο επίπεδο της ανθρώπινης αντίληψης, με το Τεστ του Turing να θεωρείται πλέον ανεπαρκές για τα σύγχρονα, εξαιρετικά πολύπλοκα μεγάλα γλωσσικά μοντέλα (LLMs). Η ερευνητική ομάδα της Google DeepMind επιχειρεί να κλείσει αυτό το χάσμα, δημοσιεύοντας ένα ολοκληρωμένο πλαίσιο που θυμίζει έντονα τα επίπεδα αυτονομίας της αυτοκινητοβιομηχανίας (Levels of Autonomous Driving).

Η βασική αρχή του νέου πλαισίου είναι η απόρριψη του «όλα ή τίποτα». Η νοημοσύνη δεν είναι ένας διακόπτης που απλώς ανάβει. Είναι ένα φάσμα ικανοτήτων που αναπτύσσεται σταδιακά. Εστιάζοντας στην απόδοση και τη γενικότητα, η Google προτείνει μια μεθοδολογία που επιτρέπει στους μηχανικούς, τους νομοθέτες και το ευρύ κοινό να κατανοήσουν ακριβώς πού βρισκόμαστε στον χάρτη της ανάπτυξης του AGI.

Τα 5 επίπεδα του AGI: Από την ανάδυση στην υπεροχή

Το πλαίσιο της DeepMind ταξινομεί την Τεχνητή Νοημοσύνη σε πέντε διακριτά επίπεδα, συγκρίνοντας την απόδοση του συστήματος με αντίστοιχα ποσοστά ανθρώπινων δεξιοτήτων.

Επίπεδο 1: Emerging (Αναδυόμενο AGI)

Αυτό είναι το στάδιο στο οποίο βρισκόμαστε σήμερα. Συστήματα όπως το Gemini της Google ή το ChatGPT της OpenAI εμπίπτουν σε αυτή την κατηγορία. Μπορούν να εκτελέσουν μια ευρεία γκάμα εργασιών, αλλά συχνά η απόδοσή τους είναι ίση ή ελαφρώς κατώτερη από έναν ανειδίκευτο άνθρωπο. Διαθέτουν γενικότητα, αλλά τους λείπει η απόλυτη εξειδίκευση.

Επίπεδο 2: Competent (Ικανό AGI)

Σε αυτό το επίπεδο, η τεχνητή νοημοσύνη αγγίζει το 50ο εκατοστημόριο των ειδικευμένων ενηλίκων. Αυτό σημαίνει ότι το σύστημα μπορεί να αντικαταστήσει ή να λειτουργήσει συμπληρωματικά με επαγγελματίες μέσου επιπέδου σε διάφορους κλάδους, εκτελώντας σύνθετες εργασίες με συνέπεια, χωρίς συνεχή επίβλεψη για διόρθωση βασικών σφαλμάτων.

Επίπεδο 3: Expert (Εξειδικευμένο AGI)

Εδώ η κλίμακα δυσκολεύει δραματικά. Το Επίπεδο 3 αφορά συστήματα που αποδίδουν καλύτερα από το 90% των εξειδικευμένων ανθρώπων (στο κορυφαίο 10%). Ένα AI αυτού του επιπέδου θα λειτουργεί ως κορυφαίος μηχανικός λογισμικού, αναλυτής δεδομένων ή οικονομικός σύμβουλος, προσφέροντας λύσεις υψηλότατου επιπέδου.

Επίπεδο 4: Virtuoso (Βιρτουόζικο AGI)

Πρόκειται για συστήματα που κατατάσσονται στο κορυφαίο 1% των ανθρώπινων ικανοτήτων. Η τεχνητή νοημοσύνη σε αυτό το στάδιο δεν εκτελεί απλώς εντολές, αλλά σχεδιάζει, καινοτομεί και επιλύει εξαιρετικά πολύπλοκα προβλήματα με δημιουργικότητα που ελάχιστοι άνθρωποι στον πλανήτη διαθέτουν.

Επίπεδο 5: Superhuman (Υπεράνθρωπο AGI)

Το απόλυτο όριο. Συστήματα που ξεπερνούν το 100% των ανθρώπων σε όλες τις γνωστικές εργασίες. Το Superhuman AGI δεν περιορίζεται από την τρέχουσα ανθρώπινη γνώση, αλλά μπορεί να ανακαλύψει νέους τομείς της επιστήμης, να λύσει άλυτα μαθηματικά θεωρήματα και να προσφέρει καινοτομίες πέρα από την ανθρώπινη φαντασία.

Ικανότητες vs διαδικασίες: Ο κανόνας της μέτρησης

Ένα από τα πιο κρίσιμα σημεία της δημοσίευσης της DeepMind είναι η ξεκάθαρη διάκριση μεταξύ διαδικασίας και ικανότητας. Το πλαίσιο δεν εξετάζει πώς το μοντέλο φτάνει στο αποτέλεσμα (αν δηλαδή σκέφτεται "όπως ένας άνθρωπος"), αλλά τι καταφέρνει να παράγει.

Η αξιολόγηση απαιτεί τα συστήματα να δοκιμάζονται σε πραγματικές συνθήκες και σε εργασίες που απαιτούν πολλαπλά βήματα, προσαρμοστικότητα και αλληλεπίδραση με τον φυσικό ή ψηφιακό κόσμο. Παράλληλα, η DeepMind εισάγει την έννοια της "Αυτονομίας". Ένα μοντέλο μπορεί να έχει ικανότητες Επιπέδου 3 (Expert), αλλά αν απαιτεί συνεχή καθοδήγηση (prompting) από τον χρήστη, η πραγματική του χρησιμότητα μειώνεται. Τα επίπεδα αυτονομίας κυμαίνονται από συστήματα που δρουν αυστηρά ως εργαλεία στα χέρια ανθρώπων (Επίπεδο 1) έως συστήματα που δρουν ως πλήρως ανεξάρτητοι πράκτορες (Agents), ικανά να θέτουν δικούς τους υπο-στόχους για να ολοκληρώσουν μια αποστολή (Επίπεδο 5).

Αυτός ο συνδυασμός (Επίπεδο Ικανότητας + Επίπεδο Αυτονομίας) αποτελεί τον πυρήνα του νέου τρόπου μέτρησης. Οι ερευνητές τονίζουν ότι η μετάβαση προς το AGI εγκυμονεί σημαντικούς κινδύνους ασφαλείας. Όσο αυξάνεται η αυτονομία, τόσο δυσκολότερο γίνεται το alignment (η ευθυγράμμιση του συστήματος με τις ανθρώπινες αξίες).

Με τη ματιά του Techgear

Η προσέγγιση της Google DeepMind αποτελεί μια απολύτως αναγκαία ενηλικίωση της βιομηχανίας. Αφήνουμε πίσω τις αόριστες συζητήσεις περί "συνείδησης των μηχανών" και περνάμε σε αυστηρό, μετρήσιμο engineering. Για την ευρωπαϊκή και ελληνική αγορά, αυτό το πλαίσιο είναι εξαιρετικά χρήσιμο εργαλείο, ειδικά ενόψει της πλήρους εφαρμογής του AI Act. Οι τοπικές εταιρείες και startups που χτίζουν πάνω σε μοντέλα LLMs μπορούν πλέον να κατηγοριοποιήσουν τις υπηρεσίες τους βάσει συγκεκριμένων επιπέδων αυτονομίας και απόδοσης. Το να γνωρίζουμε ακριβώς τι μπορεί να κάνει ένα AI, πόσο καλά το κάνει και πόσο ανεξάρτητο είναι, αποτελεί το μοναδικό ασφαλές μονοπάτι για την εμπορική και ηθική ενσωμάτωση αυτών των τεχνολογιών στην καθημερινότητά μας.