Το ChatGPT «διαβάζει» τον Elon Musk: Η OpenAI αντλεί δεδομένα από το Grokipedia

Σε μια εξέλιξη που θυμίζει περισσότερο φάρσα της τεχνολογικής ιστορίας παρά στρατηγική κίνηση, το ChatGPT της OpenAI εντοπίστηκε να αντλεί απαντήσεις και δεδομένα από μια πηγή που ελάχιστοι θα περίμεναν: το Grokipedia. Πρόκειται για τη βάση γνώσεων που συνδέεται άμεσα με το Grok, το μοντέλο τεχνητής νοημοσύνης που δημιούργησε η xAI του Elon Musk ακριβώς για να ανταγωνιστεί την κυριαρχία του Sam Altman και της OpenAI.

Η «ακούσια» συνεργασία

Το φαινόμενο παρατηρήθηκε από χρήστες και αναλυτές που διαπίστωσαν πως η λειτουργία αναζήτησης του ChatGPT (το γνωστό πλέον SearchGPT feature) περιλάμβανε στις παραπομπές του συνδέσμους προς το Grokipedia. Αυτό συμβαίνει όταν το chatbot καλείται να απαντήσει σε ερωτήματα επικαιρότητας ή να αναλύσει δεδομένα σε πραγματικό χρόνο.

Η ειρωνεία είναι αφοπλιστική. Ο Elon Musk, ο οποίος έχει κινηθεί νομικά εναντίον της OpenAI κατηγορώντας την ότι πρόδωσε την αρχική της αποστολή για το καλό της ανθρωπότητας μετατρεπόμενη σε κερδοσκοπικό οργανισμό, βλέπει τώρα τα δεδομένα της δικής του πλατφόρμας να τροφοδοτούν τις απαντήσεις του «εχθρού».

Πώς συμβαίνει τεχνικά;

Για να κατανοήσουμε το πώς προέκυψε αυτό, πρέπει να κοιτάξουμε τον τρόπο λειτουργίας των σύγχρονων AI search engines. Το ChatGPT, στην προσπάθειά του να παρέχει ενημερωμένες πληροφορίες, «σαρώνει» τον ιστό όπως ακριβώς κάνει η Google ή το Bing.

Από τη στιγμή που η xAI αποφάσισε να κάνει δημόσια προσβάσιμες ορισμένες σελίδες απαντήσεων του Grok ή τμήματα του Grokipedia για λόγους προβολής και SEO, αυτές οι σελίδες έγιναν ορατές στους bots της OpenAI. Ο αλγόριθμος του ChatGPT δεν κάνει διακρίσεις βάσει εταιρικής αντιπαλότητας, αλλά αν κρίνει πως η πληροφορία στο Grokipedia είναι σχετική και έγκυρη, την ενσωματώνει στην απάντησή του και παραθέτει την πηγή.

Ουσιαστικά, η στρατηγική της xAI να αποκτήσει ορατότητα στο διαδίκτυο λειτούργησε ως μπούμερανγκ, προσφέροντας έτοιμη, επεξεργασμένη γνώση στο ανταγωνιστικό μοντέλο.

Ο φαύλος κύκλος των δεδομένων (AI on AI)

Το περιστατικό αυτό αναδεικνύει ένα βαθύτερο, δομικό πρόβλημα που απασχολεί έντονα την κοινότητα της τεχνολογίας: την ανακύκλωση των συνθετικών δεδομένων. Καθώς το διαδίκτυο γεμίζει με περιεχόμενο που έχει παραχθεί από μηχανές, τα μοντέλα τεχνητής νοημοσύνης αρχίζουν αναπόφευκτα να εκπαιδεύονται ή να αντλούν πληροφορίες από άλλα μοντέλα.

Στην προκειμένη περίπτωση, το ChatGPT δεν διαβάζει μια πρωτογενή ανθρώπινη πηγή, αλλά την "άποψη" του Grok πάνω σε ένα θέμα. Αυτό δημιουργεί ερωτήματα για την ποιότητα της πληροφορίας μακροπρόθεσμα. Εάν το Grok κάνει λάθος (το λεγόμενο hallucination) και το ChatGPT υιοθετήσει αυτό το λάθος ως πηγή, δημιουργείται μια αλυσίδα παραπληροφόρησης που είναι εξαιρετικά δύσκολο να σπάσει.

Η αντίδραση του Musk και το μέλλον

Μέχρι στιγμής, η πλευρά της xAI δεν έχει προβεί σε επίσημες κινήσεις για να μπλοκάρει τους crawlers της OpenAI, αν και τεχνικά αυτό είναι εφικτό μέσω μιας απλής τροποποίησης στο αρχείο robots.txt της ιστοσελίδας. Ωστόσο, δεδομένης της εκρηκτικής προσωπικότητας του Musk και της ιστορίας του με την OpenAI, μια τέτοια κίνηση φαντάζει θέμα χρόνου.

Η κατάσταση περιπλέκεται καθώς η xAI προσπαθεί να εδραιωθεί ως η εναλλακτική λύση απέναντι στην «woke» (όπως την χαρακτηρίζει ο Musk) προσέγγιση του ChatGPT. Το γεγονός ότι το ChatGPT θεωρεί το Grokipedia αξιόπιστη πηγή θα μπορούσε να ερμηνευθεί με δύο τρόπους: είτε ως παραδοχή της ποιότητας των δεδομένων της xAI, είτε ως απόδειξη ότι η OpenAI «πεινάει» για δεδομένα σε τέτοιο βαθμό που δεν διστάζει να κοιτάξει ακόμη και στην αυλή του ανταγωνιστή.

Τι σημαίνει αυτό για τους χρήστες

Για τον μέσο χρήστη, αυτή η εξέλιξη υπογραμμίζει την ανάγκη για κριτική σκέψη απέναντι στις απαντήσεις των AI εργαλείων. Όταν ρωτάτε το ChatGPT για ένα θέμα επικαιρότητας, η απάντηση που λαμβάνετε μπορεί να είναι ένα κράμα πληροφοριών από παραδοσιακά μέσα ενημέρωσης και αναλύσεις που έχει κάνει ήδη μια άλλη τεχνητή νοημοσύνη.

Η διαφάνεια στις πηγές – κάτι που το ChatGPT έχει αρχίσει να εφαρμόζει πιο επιθετικά – είναι το μόνο εργαλείο που επιτρέπει στον χρήστη να καταλάβει την προέλευση της πληροφορίας. Αν δείτε «Πηγή: Grokipedia», γνωρίζετε πλέον ότι παρακολουθείτε έναν διάλογο μεταξύ μηχανών, με τον ανθρώπινο παράγοντα να περνάει σιγά-σιγά σε δεύτερη μοίρα.

Loading