RSL: Η μεγάλη πρωτοβουλία για να πληρώνουν οι AI εταιρείες για την εκπαίδευση των μοντέλων τους

Μια νέα πρωτοβουλία φιλοδοξεί να αλλάξει ριζικά τον τρόπο με τον οποίο οι εταιρείες τεχνητής νοημοσύνης χρησιμοποιούν περιεχόμενο από τον παγκόσμιο ιστό. Την περασμένη Τετάρτη, μεγάλες πλατφόρμες όπως οι Reddit, Yahoo, Medium, Quora και People Inc. ανακοίνωσαν ότι στηρίζουν το Really Simple Licensing (RSL), ένα ανοιχτό πρότυπο αδειοδότησης περιεχομένου. Μέσω του RSL, οι εκδότες αποκτούν για πρώτη φορά τη δυνατότητα να θέτουν όρους και αμοιβές για τα δεδομένα τους, όταν αυτά χρησιμοποιούνται στην εκπαίδευση συστημάτων τεχνητής νοημοσύνης.

Από το robots.txt στο RSL

Η νέα πρόταση πατάει πάνω σε μια παλιά τεχνολογική σύμβαση: το robots.txt, που εδώ και χρόνια επιτρέπει στους διαχειριστές ιστοσελίδων να δηλώνουν ποια τμήματα μπορούν ή δεν μπορούν να ανιχνεύσουν τα bots. Το RSL επεκτείνει αυτή τη λογική, επιτρέποντας πλέον όχι μόνο την αποδοχή ή την άρνηση, αλλά και τον καθορισμό όρων χρήσης και πληρωμής. Έτσι, οι ιστότοποι μπορούν να απαιτούν δικαιώματα για περιεχόμενο όπως άρθρα, βίντεο ή ακόμη και datasets που ενδέχεται να χρησιμοποιηθούν για την εκπαίδευση μοντέλων AI.

Η δημιουργία του RSL Collective

Πίσω από το νέο πρότυπο βρίσκεται το RSL Collective, ένας οργανισμός διαχείρισης δικαιωμάτων που ίδρυσαν ο Eckart Walther –συνδημιουργός του Really Simple Syndication (RSS)– και ο Doug Leeds, πρώην CEO της IAC Publishing και του Ask.com. Στόχος, όπως εξηγεί ο Walther, είναι η διαμόρφωση ενός «νέου, κλιμακούμενου επιχειρηματικού μοντέλου για τον ιστό». Το RSL, όπως λέει, αξιοποιεί τις ιδέες του RSS και προσθέτει ένα νέο στρώμα στην αρχιτεκτονική του διαδικτύου, όπου πλέον ορίζονται ρητά τα δικαιώματα αδειοδότησης και αποζημίωσης.

Διαφορετικά μοντέλα πληρωμής

Το RSL προσφέρει ευελιξία στους δημιουργούς. Μια ιστοσελίδα μπορεί να ζητήσει από τις εταιρείες τεχνητής νοημοσύνης να πληρώνουν είτε συνδρομή, είτε χρέωση ανά ανίχνευση (pay-per-crawl). Υπάρχει ακόμη και η επιλογή για pay-per-inference, δηλαδή αμοιβή κάθε φορά που ένα μοντέλο AI χρησιμοποιεί το περιεχόμενο του ιστότοπου για να παράξει μια απάντηση. Σημαντικό είναι ότι τα bots με άλλες αποστολές, όπως η αρχειοθέτηση ή η καταχώριση σε μηχανές αναζήτησης, συνεχίζουν να λειτουργούν χωρίς περιορισμούς.

Οι πρώτες συμφωνίες και οι δυσκολίες

Μέχρι σήμερα, μεγάλες εκδοτικές εταιρείες όπως η Vox Media, η News Corp και οι New York Times έχουν προχωρήσει σε ατομικές συμφωνίες αδειοδότησης με εταιρείες όπως οι OpenAI και Amazon. Ωστόσο, το RSL Collective επιχειρεί να απλοποιήσει τη διαδικασία, προσφέροντας μια ενιαία πλατφόρμα όπου οποιοσδήποτε εκδότης, μικρός ή μεγάλος, μπορεί να εξασφαλίσει αμοιβή χωρίς να χρειάζεται ξεχωριστές διαπραγματεύσεις.

Η πρόκληση, ωστόσο, είναι ότι η επιτυχία του RSL εξαρτάται από τη συμμετοχή των ίδιων των εταιρειών τεχνητής νοημοσύνης. Πολλές έχουν κατηγορηθεί στο παρελθόν ότι αγνοούν το robots.txt, ενώ η καταμέτρηση χρεώσεων τύπου inference είναι τεχνικά δύσκολη χωρίς τη συνεργασία τους.

Τεχνολογικοί «πορτιέρηδες» στο παιχνίδι

Το RSL από μόνο του δεν έχει τη δυνατότητα να αποκλείσει bots από μια ιστοσελίδα, κάτι που ήδη προσφέρει η Cloudflare με το σύστημα «pay per crawl». Για αυτόν τον λόγο, το RSL Collective συνεργάζεται με το Fastly, ένα μεγάλο δίκτυο διανομής περιεχομένου (CDN). Η ιδέα είναι ότι το Fastly θα λειτουργεί ως «θυρωρός», επιτρέποντας την είσοδο μόνο σε bots που έχουν αποδεχθεί τους όρους αδειοδότησης. «Το Fastly είναι σαν τον πορτιέρη ενός κλαμπ. Ελέγχει την ταυτότητα και μόνο όσοι έχουν το σωστό ID μπορούν να περάσουν», δήλωσε χαρακτηριστικά ο Leeds.

Νομικό πλαίσιο και διεκδικήσεις

Το RSL Collective φιλοδοξεί να λειτουργήσει όπως οι οργανισμοί συλλογικής διαχείρισης δικαιωμάτων στη μουσική, όπως η ASCAP, που εισπράττουν αμοιβές και τις μοιράζουν στα μέλη τους. Ωστόσο, ενώ το copyright στη μουσική έχει ισχυρή νομική κατοχύρωση, η χρήση διαδικτυακού περιεχομένου για την εκπαίδευση AI παραμένει μια «γκρίζα ζώνη». Ήδη μεγάλες εταιρείες τεχνητής νοημοσύνης βρίσκονται αντιμέτωπες με αγωγές από το Reddit, την Getty Images και άλλους εκδότες.

Παρά τις νομικές αβεβαιότητες, το RSL υπόσχεται να βάλει τέλος στο κενό συνεννόησης που υπήρχε μέχρι τώρα. «Υπήρχε πάντα το ερώτημα αν τα bots συμφωνούν με όρους που δεν βλέπουν ποτέ. Το RSL το αλλάζει αυτό, αφού πλέον τίθενται σαφείς όροι πριν την πρόσβαση», υπογράμμισαν οι Walther και Leeds σε κοινή δήλωση.

Γιατί έχει σημασία το RSL

Οι υποστηρικτές του νέου προτύπου πιστεύουν ότι προσφέρει έναν πιο δίκαιο και διαφανή τρόπο για να αποζημιώνονται οι δημιουργοί περιεχομένου. Αν λειτουργήσει σωστά, θα μπορούσε να δημιουργήσει για το διαδίκτυο ένα αντίστοιχο πλαίσιο με εκείνο που υπάρχει ήδη στις βιομηχανίες μουσικής, κινηματογράφου και εκδόσεων. Όπως λέει ο Leeds, «δεν επινοούμε ξανά τον τροχό, απλώς τον τοποθετούμε σε ένα πεδίο όπου δεν υπήρχε πριν».

Ήδη, μεγάλα ονόματα όπως τα O’Reilly, wikiHow και Ziff Davis (ιδιοκτήτης του IGN) έχουν δηλώσει συμμετοχή. Το RSL Collective είναι ανοιχτό και δωρεάν για κάθε εκδότη ή δημιουργό που θέλει να προστατεύσει το έργο του και να διεκδικήσει μερίδιο από την αξία που παράγεται χάρη στο περιεχόμενό του.

[via]

Loading