Η Encyclopedia Britannica μηνύει την OpenAI για κλοπή 100.000 άρθρων

Σύνοψη

Η Encyclopedia Britannica και η θυγατρική της, Merriam-Webster, κατέθεσαν μήνυση κατά της OpenAI στο ομοσπονδιακό δικαστήριο του Μανχάταν στις 13 Μαρτίου 2026.
Η εταιρεία κατηγορείται για παράνομη υποκλοπή και χρήση σχεδόν 100.000 άρθρων, λημμάτων και ορισμών για την εκπαίδευση των μεγάλων γλωσσικών μοντέλων (LLMs) που τροφοδοτούν το ChatGPT.
Οι ενάγοντες υποστηρίζουν ότι το ChatGPT αναπαράγει το περιεχόμενό τους σχεδόν αυτολεξεί, γεγονός που προκαλεί άμεση οικονομική ζημία μειώνοντας δραματικά την επισκεψιμότητα των ιστοσελίδων τους.
Εγείρονται επίσης ζητήματα παραβίασης εμπορικού σήματος, καθώς το σύστημα τεχνητής νοημοσύνης συχνά επικαλείται την Britannica ως πηγή σε ανακριβείς απαντήσεις (AI hallucinations), πλήττοντας την αξιοπιστία του οργανισμού.

Η νομική σύγκρουση μεταξύ των παραδοσιακών εκδοτών και των κολοσσών της τεχνητής νοημοσύνης κλιμακώνεται ραγδαία, με την Encyclopedia Britannica και τη θυγατρική της, Merriam-Webster, να αποτελούν τον πιο πρόσφατο κρίκο σε μια μακρά αλυσίδα δικαστικών προσφυγών.

Η αγωγή, η οποία κατατέθηκε στο ομοσπονδιακό δικαστήριο του Μανχάταν, στρέφεται κατά της OpenAI, της εταιρείας πίσω από το ChatGPT, θέτοντας στο μικροσκόπιο τον πυρήνα της λειτουργίας των παραγωγικών AI μοντέλων: τη συλλογή και χρήση δεδομένων εκπαίδευσης.

Η συγκεκριμένη νομική κίνηση δεν αποτελεί απλώς μια διεκδίκηση διαφυγόντων κερδών, αλλά αγγίζει θεμελιώδη τεχνικά ζητήματα γύρω από τη λειτουργία της μηχανικής μάθησης και το μέλλον της πνευματικής ιδιοκτησίας στο ψηφιακό περιβάλλον.

Η τεχνική διάσταση: Πώς το ChatGPT αφομοίωσε 100.000 άρθρα

Πώς ακριβώς καταφέρνει ένα γλωσσικό μοντέλο να αποστηθίσει τεράστιους όγκους δεδομένων; Η απάντηση κρύβεται στη διαδικασία του web scraping και της προ-εκπαίδευσης. Η OpenAI, σύμφωνα με τη μήνυση, προχώρησε στη μαζική εξαγωγή δεδομένων από τις ιστοσελίδες της Britannica και του Merriam-Webster, ενσωματώνοντας σχεδόν 100.000 άρθρα, εγκυκλοπαιδικά λήμματα και λεξικογραφικούς ορισμούς στα datasets που χρησιμοποιήθηκαν για την εκπαίδευση της σειράς μοντέλων GPT-4.

Το πρόβλημα που επισημαίνεται δεν είναι απλώς η ανάγνωση των δεδομένων, αλλά η ικανότητα των παραμέτρων του δικτύου να αποθηκεύουν σημασιολογικές δομές σε τέτοιο βαθμό, ώστε κατά τη διαδικασία της παραγωγής, το μοντέλο να εξάγει κείμενο που ταυτίζεται σχεδόν απόλυτα με το πρωτότυπο.

Τα βασικά τεχνικά επιχειρήματα της αγωγής

Near-Verbatim Αναπαραγωγή: Αντί να συνθέτει νέες απαντήσεις βάσει γενικής γνώσης, το GPT-4 κατηγορείται ότι λειτουργεί ως βάση δεδομένων που επιστρέφει ακριβή αντίγραφα παραγράφων.
Παράκαμψη Paywalls: Η εκπαίδευση σε premium περιεχόμενο επιτρέπει στους χρήστες του ChatGPT να λαμβάνουν απαντήσεις υψηλής αξίας χωρίς να επισκέπτονται τις πηγές, ακυρώνοντας τα συνδρομητικά και διαφημιστικά μοντέλα.
Απουσία Αδειοδότησης: Σε αντίθεση με τις πρόσφατες συμφωνίες της OpenAI με εκδότες (όπως το Associated Press ή το Axel Springer), η χρήση του υλικού της Britannica έγινε χωρίς καμία απολύτως άδεια χρήσης.

Οικονομικός αντίκτυπος και zero-click εμπειρία

Ο άμεσος αντίκτυπος αυτής της πρακτικής αποτυπώνεται στα analytics των παραδοσιακών ιστοσελίδων. Η μετάβαση των μηχανών αναζήτησης και των chatbots σε μοντέλα παροχής απευθείας απαντήσεων δημιουργεί την απόλυτη «zero-click» εμπειρία. Ο χρήστης θέτει ένα ερώτημα και η AI του σερβίρει την έτοιμη απάντηση, κρατώντας τον εντός της πλατφόρμας του (π.χ. στο interface του ChatGPT).

Για πλατφόρμες όπως η Encyclopedia Britannica, των οποίων η βιωσιμότητα εξαρτάται άμεσα από την επισκεψιμότητα για την προβολή διαφημίσεων ή την πώληση συνδρομών (όπως και η πλειοψηφία των ειδησεογραφικών ιστοσελίδων σαν το techgear.gr), η πτώση της οργανικής κίνησης είναι καταστροφική. Η εταιρεία αναφέρει ρητά στην αγωγή της ότι το web traffic της καταβαραθρώνεται, καθώς η OpenAI έχει πρακτικά υποκαταστήσει την ίδια την εγκυκλοπαίδεια για ένα μεγάλο τμήμα του κοινού.

Παραβίαση εμπορικού σήματος και "παραισθήσεις" της AI

Ένα από τα πιο ενδιαφέροντα στοιχεία της αγωγής, το οποίο διαφοροποιείται από τις τυπικές διεκδικήσεις περί copyright, είναι η κατηγορία για παραβίαση εμπορικού σήματος. Τα μεγάλα γλωσσικά μοντέλα είναι γνωστό ότι συχνά παράγουν πειστικές, αλλά απολύτως λανθασμένες πληροφορίες, ένα φαινόμενο γνωστό ως AI hallucinations.

Σύμφωνα με τους νομικούς εκπροσώπους της Britannica, το ChatGPT συχνά παράγει λανθασμένα δεδομένα και τα αποδίδει ρητά στην Encyclopedia Britannica ή στο Merriam-Webster. Αυτή η πρακτική όχι μόνο παραπλανά τους χρήστες υποδηλώνοντας μια ανύπαρκτη συνεργασία μεταξύ των δύο εταιρειών, αλλά διαβρώνει και την 250 ετών φήμη αξιοπιστίας του οργανισμού. Όταν η AI προσφέρει μια ανακρίβεια επικαλούμενο την πιο διάσημη εγκυκλοπαίδεια του κόσμου, η ευθύνη στα μάτια του απλού χρήστη μετατοπίζεται άδικα προς τον εκδότη.

Το νομικό πλαίσιο και οι αλυσιδωτές αντιδράσεις

Η υπόθεση Britannica προστίθεται σε μια ογκώδη λίστα δικαστικών μαχών. Η OpenAI έχει ήδη βρεθεί αντιμέτωπη με αγωγές από τους New York Times, την Authors Guild, μεγάλους ειδησεογραφικούς οργανισμούς ανά τον κόσμο (όπως η ANI Media στην Ινδία), ενώ η ίδια η Britannica έχει μηνύσει και την Perplexity AI για παρόμοιους λόγους από τον Σεπτέμβριο του 2025.

Ο πυρήνας της υπερασπιστικής γραμμής της OpenAI περιστρέφεται διαρκώς γύρω από το δόγμα της «ορθής χρήσης». Η εταιρεία υποστηρίζει ότι η χρήση δημόσια διαθέσιμων δεδομένων για την εκπαίδευση αλγορίθμων αποτελεί μετασχηματιστική χρήση που προάγει την καινοτομία. Ωστόσο, τα δικαστήρια διεθνώς αρχίζουν να δείχνουν διαφορετικές διαθέσεις. Ενώ στις ΗΠΑ η νομολογία παραμένει ρευστή, στην Ευρώπη το πλαίσιο είναι πιο αυστηρό.

Σε μια υποθετική εφαρμογή αυτού του σεναρίου στην ευρωπαϊκή και δη στην ελληνική αγορά, η εφαρμογή του EU AI Act και της Οδηγίας για τα Πνευματικά Δικαιώματα στην Ψηφιακή Ενιαία Αγορά, απαιτεί πλέον από τις εταιρείες AI να σέβονται τις εξαιρέσεις εξόρυξης κειμένου και δεδομένων. Ελληνικοί όμιλοι μέσων ενημέρωσης και δημιουργοί περιεχομένου παρακολουθούν στενά αυτές τις υποθέσεις, καθώς τα δικά τους δεδομένα ενδέχεται να αποτελούν ήδη μέρος των εκπαιδευτικών συνόλων χωρίς την παραμικρή οικονομική αποζημίωση.

Η άποψη του Techgear

Η αγωγή της Encyclopedia Britannica κατά της OpenAI δεν προκαλεί έκπληξη. Αποτελεί τη φυσική εξέλιξη της παρασιτικής σχέσης που έχει αναπτυχθεί μεταξύ της βιομηχανίας της τεχνητής νοημοσύνης και των παραγωγών πρωτογενούς περιεχομένου. Τα γλωσσικά μοντέλα, όσο προηγμένα κι αν είναι, παραμένουν "μαύρα κουτιά" στατιστικής ανάλυσης λέξεων. Χωρίς την ποιοτική πληροφορία, την έρευνα και την εγκυρότητα οργανισμών όπως η Britannica, το output των LLMs μετατρέπεται σε θόρυβο.

Δυστυχώς γινόμαστε μάρτυρες μιας σχεδόν παγιωμένης κατάστασης όπου η τεχνολογική πρόοδος χτίζεται πάνω στην καταστροφή των δημιουργών. Η στρατηγική του "συλλέγουμε τα πάντα δωρεάν τώρα, και πληρώνουμε πρόστιμα αργότερα" δεν είναι βιώσιμη. Η μετάβαση της αγοράς σε ένα δίκαιο μοντέλο αδειοδότησης, όπου οι AI πλατφόρμες θα καταβάλλουν πνευματικά δικαιώματα για την εμπορική χρήση του περιεχομένου, αποτελεί μονόδρομο.

Διαφορετικά, το οικοσύστημα του διαδικτύου θα οδηγηθεί σε πλήρη μαρασμό, καθώς δεν θα υπάρχει κανένα οικονομικό κίνητρο για την παραγωγή αξιόπιστης και πρωτότυπης πληροφορίας, αφήνοντας τις μηχανές να εκπαιδεύονται αποκλειστικά πάνω σε περιεχόμενο που παρήγαγαν άλλες μηχανές.