Ο νέος AI agent της Google DeepMind μπορεί να παίζει μόνος του video games

Η Google DeepMind έδωσε μια πρώτη ματιά στο SIMA 2, τον νέο AI agent που μπορεί να μάθει μόνος του να παίζει video games και να λειτουργεί ως «διαδραστικός ψηφιακός σύντροφος» μέσα στους εικονικούς κόσμους. Η νέα έκδοση δεν περιορίζεται σε βασικές εντολές, αλλά αναλύει στόχους, σχεδιάζει και εκτελεί πολύπλοκες ενέργειες και μάλιστα σε παιχνίδια που δεν έχει ξαναδεί ποτέ.

Ο SIMA 2 χτίζει πάνω στο αρχικό SIMA (Scalable Instructable Multiworld Agent), το οποίο παρουσιάστηκε τον Μάρτιο του 2024. Αυτή τη φορά όμως ενσωματώνει για πρώτη φορά το Google Gemini, δίνοντας στο σύστημα τη δυνατότητα όχι απλώς να υπακούει σε οδηγίες αλλά να καταλαβαίνει τον ευρύτερο στόχο του χρήστη, να κάνει αιτιολόγηση και να δρα με συνέπεια και αποτελεσματικότητα. Αυτό το upgrade επιτρέπει στον agent να παίξει διαφορετικά είδη παιχνιδιών χωρίς ειδική εκπαίδευση για το καθένα.

Η λίστα των τίτλων που δοκιμάστηκαν δεν είναι τυχαία: No Man’s Sky, Valheim, Goat Simulator 3 και άλλα παιχνίδια που απαιτούν εξερεύνηση, crafting, μάχη, συνεργασία και αυτοσχεδιασμό. Έτσι, η DeepMind θέλει να αποδείξει ότι το AI μπορεί να προσαρμόζεται σε open worlds με χαοτική και απρόβλεπτη συμπεριφορά — κάτι που μέχρι τώρα κανένα agent δεν είχε δείξει σε τέτοιο εύρος.

Το εργαλείο είναι διαθέσιμο σε περιορισμένη μορφή για ακαδημαϊκούς και developers ως research preview. Ωστόσο, η DeepMind ξεκαθαρίζει πως ο σκοπός δεν είναι να φτιαχτεί μια consumer υπηρεσία τύπου «AI βοηθός για video games». Όπως ανέφερε η Jane Wang, senior staff research scientist στο DeepMind, οι εικονικοί κόσμοι λειτουργούν ως ιδανικό περιβάλλον εκπαίδευσης για να μεταφερθούν κάποια μέρα οι δεξιότητες του agent στον πραγματικό κόσμο. Με απλά λόγια, τα video games δεν είναι ο στόχος, αλλά το μέσο.

Ουσιαστικά, η DeepMind χρησιμοποιεί τα παιχνίδια ως sandbox για να λύσει πολύ πιο μεγάλα προβλήματα στην τεχνητή νοημοσύνη. Αν μια AI μπορεί να μάθει πώς να επιβιώσει σε ένα procedural σύμπαν όπως το No Man’s Sky ή να διαχειριστεί ένα συνεργατικό survival game όπως το Valheim χωρίς προκαθορισμένα scripts, τότε μπορεί θεωρητικά να μάθει και να ανταποκριθεί σε καταστάσεις πραγματικής ζωής όπου οι μεταβλητές είναι ατελείωτες και η αβεβαιότητα υψηλή.

Όπως ήταν αναμενόμενο, η DeepMind μιλά ανοιχτά για την κούρσα προς το Artificial General Intelligence (AGI), το μεγάλο τελικό τρόπαιο στην τεχνολογία σήμερα. Στο επίσημο blog post, η ομάδα τονίζει ότι ο SIMA 2 αποτελεί «σημαντικό βήμα προς την AGI, με κρίσιμες προεκτάσεις για το μέλλον της ρομποτικής και των ενσώματων AI συστημάτων». Οι αναφορές αυτές δείχνουν ξεκάθαρα ότι η Google δεν αντιλαμβάνεται τον SIMA 2 ως project ψυχαγωγίας, αλλά ως πειραματικό θεμέλιο για γενικευμένες νοημοσύνες.

Ο Joe Marino, research scientist στη DeepMind, χαρακτήρισε κομβικό το γεγονός ότι το AI μπορεί να παίρνει αποφάσεις και να δρα μέσα σε εικονικά περιβάλλοντα που δεν έχει ξανασυναντήσει ποτέ. Κατά την άποψή του, αυτή η ικανότητα είναι «θεμελιώδες» βήμα προς την AGI και ίσως η βάση για τη δημιουργία ενός μελλοντικού «general-purpose robot» που θα μπορεί να λειτουργεί στον φυσικό κόσμο.