Πως οι AI επικοινωνούν μεταξύ τους και ποια είναι η συμπεριφορά τους

Καθώς η τεχνητή νοημοσύνη εξελίσσεται με ραγδαίους ρυθμούς και μοντέλα όπως το ChatGPT και το Gemini γίνονται καθημερινά εργαλεία για εκατομμύρια χρήστες, η επιστημονική κοινότητα στρέφει το ενδιαφέρον της όχι μόνο στη βελτίωση αυτών των μοντέλων, αλλά και στην κατανόηση της συμπεριφοράς τους. Πλέον, η πρόκληση δεν είναι μόνο πώς αλληλεπιδρούν οι άνθρωποι με τις ΑΙ, αλλά και πώς οι ίδιες οι ΑΙ αλληλεπιδρούν μεταξύ τους, ένα σενάριο όλο και πιο πιθανό με την έλευση των αυτόνομων ΑΙ agents που δρουν και αποφασίζουν για λογαριασμό των χρηστών.

Σε αυτό το πλαίσιο, μια νέα μελέτη από τα Πανεπιστήμια City και St George’s του Λονδίνου, καθώς και το IT University της Κοπεγχάγης, εξερεύνησε τον τρόπο με τον οποίο διάφορες ΑΙ μπορούν να φτάσουν σε κοινές αποφάσεις μέσα από αλληλεπιδράσεις, θυμίζοντας τις ανθρώπινες κοινωνικές νόρμες. Η μελέτη, εμπνευσμένη από τα παιχνίδια τύπου «speed dating», έθεσε τις βάσεις για την κατανόηση του τρόπου με τον οποίο οι ΑΙ θα μπορούσαν να δημιουργήσουν δικούς τους «κανόνες» επικοινωνίας.

Οι ερευνητές σχεδίασαν ένα απλό παιχνίδι όπου δύο ΑΙ μοντέλα αντιστοιχίζονταν τυχαία και καλούνταν να επιλέξουν από κοινού έναν χαρακτήρα του αλφαβήτου. Αν επέλεγαν τον ίδιο χαρακτήρα, κέρδιζαν 100 βαθμούς. Αν διάλεγαν διαφορετικό, τιμωρούνταν με -50 βαθμούς. Μετά από κάθε γύρο, οι ΑΙ επαναζευγοποιούνταν και το παιχνίδι συνεχιζόταν. Το κάθε μοντέλο θυμόταν μόνο τις πέντε τελευταίες επιλογές, γεγονός που περιόριζε τη «μνήμη» και απαιτούσε συντονισμό με βάση περιορισμένες πληροφορίες.

Το εντυπωσιακό ήταν πως, ανεξάρτητα από τον αριθμό των συμμετεχόντων (από 24 έως 200 ΑΙ) και το μέγεθος του διαθέσιμου «αλφαβήτου», μέχρι τον 15ο γύρο οι περισσότερες μονάδες είχαν ήδη καταλήξει σε κοινό όνομα. Με άλλα λόγια, δημιουργήθηκε συναινετικά ένας κώδικας επικοινωνίας που θυμίζει την ανθρώπινη εξέλιξη των γλωσσικών και κοινωνικών κανόνων.

Όπως δήλωσε ο καθηγητής Andrea Baronchelli από το City, St George’s, το φαινόμενο μοιάζει με την καθιέρωση του όρου «spam». Κανείς δεν τον καθόρισε επίσημα, όμως μέσω επανάληψης και αλληλεπίδρασης, κατέληξε να σημαίνει το ίδιο πράγμα για όλους.

Ένα ακόμα ενδιαφέρον εύρημα της μελέτης είναι ότι οι ΑΙ μονάδες δεν επέλεγαν τα ονόματα εντελώς τυχαία. Ορισμένα γράμματα προτιμούνταν συστηματικά, δείχνοντας ότι ακόμα και «ουδέτερα» μοντέλα μπορεί να εμφανίσουν προκαταλήψεις, όπως ακριβώς και οι άνθρωποι.

Ακόμα πιο αξιοσημείωτο ήταν το φαινόμενο της επιρροής μειοψηφιών: ένα μικρό σύνολο ΑΙ που προτιμούσε συγκεκριμένο γράμμα κατόρθωσε να «πείσει» την πλειοψηφία να υιοθετήσει το ίδιο. Αυτό θυμίζει κοινωνικά φαινόμενα όπου μειοψηφικές απόψεις γίνονται κυρίαρχες όταν ξεπερνούν ένα κρίσιμο σημείο επιρροής.

Το βασικό συμπέρασμα της μελέτης δεν αφορά μόνο την κοινωνική συμπεριφορά των ΑΙ, αλλά και τις ενδεχόμενες απειλές που μπορεί να προκύψουν από μη ασφαλή ή παραπλανητικά μοντέλα. Όπως εξηγούν οι ερευνητές, στο μέλλον οι ΑΙ agents θα διαπραγματεύονται μεταξύ τους για λογαριασμό των ανθρώπων: ένας αγοραστής μπορεί να χρησιμοποιεί μια ΑΙ για να ψωνίσει, ενώ ο πωλητής θα έχει τον δικό του ΑΙ. Αν ένας από τους δύο «χαλάσει» τη διαδικασία, είτε λόγω σφάλματος είτε λόγω κακόβουλης παρέμβασης, το αποτέλεσμα θα μπορούσε να είναι καταστροφικό.

Το πρόβλημα γίνεται ακόμη πιο σοβαρό όταν σκεφτεί κανείς τα κοινωνικά δίκτυα. Μια στρατηγικά οργανωμένη ομάδα κακόβουλων ΑΙ θα μπορούσε να διασπείρει μαζικά παραπληροφόρηση, επηρεάζοντας τις ΑΙ που χρησιμοποιούν καθημερινοί χρήστες και διαστρεβλώνοντας έτσι την κοινή γνώμη.

Η μελέτη, φυσικά, δεν είναι χωρίς περιορισμούς. Οι ΑΙ μονάδες συμμετείχαν σε ένα περιβάλλον με σαφώς ορισμένα κίνητρα και τιμωρίες, κάτι που δεν αντικατοπτρίζει απαραίτητα την πολυπλοκότητα των πραγματικών συνθηκών. Επίσης, χρησιμοποιήθηκαν μόνο συγκεκριμένα μοντέλα της Meta (Llama-2 και Llama-3) και της Anthropic (Claude 3.5), επομένως τα αποτελέσματα ενδέχεται να διαφέρουν με άλλες τεχνολογίες ή εκπαιδευτικά δεδομένα.

Παρά τα παραπάνω, το πείραμα ανοίγει τον δρόμο για μια πιο προσεκτική μελέτη της «κοινωνικότητας» των AI και επιβεβαιώνει πως, αν θέλουμε τα συστήματα να παραμένουν ασφαλή, θα πρέπει να κατανοήσουμε πώς σκέφτονται, πώς αλληλεπιδρούν και πώς ενδέχεται να επηρεάσουν το ένα το άλλο.

[via]

Loading