Technology

Το arXiv τιμωρεί με ετήσιο αποκλεισμό τους ερευνητές που αναρτούν AI Slop

Σύνοψη

Το arXiv, το κορυφαίο αποθετήριο προδημοσιεύσεων για την ακαδημαϊκή κοινότητα, ανακοίνωσε την επιβολή άμεσου αποκλεισμού 1 έτους σε επιστήμονες που υποβάλλουν έρευνες γεμάτες αδιόρθωτα λάθη τεχνητής νοημοσύνης (AI slop).
Η απόφαση, την οποία επιβεβαίωσε ο Thomas G. Dietterich (Πρόεδρος του τμήματος Computer Science του arXiv), εστιάζει στην τιμωρία κειμένων που περιέχουν «παραισθήσεις» και τυπικά υπολείμματα εντολών των Large Language Models (LLMs).
Οι παραβάτες ερευνητές, μετά την πάροδο του 12μηνου αποκλεισμού, θα υποχρεούνται να αποδείξουν την εγκυρότητά τους περνώντας τις επόμενες δημοσιεύσεις τους πρώτα από αυστηρή διαδικασία peer-review.
Το πρόβλημα έχει λάβει ανεξέλεγκτες διαστάσεις. Ενδεικτικά, στο διεθνές συνέδριο ICLR του 2026 διαπιστώθηκε πως το 21% των αξιολογήσεων (peer reviews) παρήχθη εξ ολοκλήρου από αλγόριθμους AI.
Η εξέλιξη αυτή επηρεάζει άμεσα και τα ελληνικά ακαδημαϊκά ιδρύματα (ΕΜΠ, ΑΠΘ, ΕΚΠΑ), τα οποία στηρίζονται στη συγκεκριμένη πλατφόρμα για την κατοχύρωση της επιστημονικής πρωτοτυπίας και τη διάχυση του ερευνητικού τους έργου.

Η εκθετική άνοδος της παραγωγικής τεχνητής νοημοσύνης έχει αναδιαμορφώσει τα εργαλεία της σύγχρονης επιστημονικής έρευνας. Παράλληλα, όμως, έχει δημιουργήσει ένα πρωτοφανές πρόβλημα ποιότητας στα ακαδημαϊκά αποθετήρια. Το arXiv.org, ένας από τους σημαντικότερους και ιστορικότερους κόμβους δωρεάν προδημοσιεύσεων (preprints) επιστημονικών ερευνών παγκοσμίως, προχωρά στη λήψη των πιο δραστικών μέτρων στα χρονικά της λειτουργίας του.

Ο οργανισμός ανακοίνωσε την επιβολή ποινής αποκλεισμού διάρκειας ενός (1) έτους για τους συγγραφείς που υποβάλλουν ακαδημαϊκά κείμενα τα οποία περιέχουν εμφανή ίχνη αυτοματοποιημένης παραγωγής κειμένου χωρίς την παραμικρή ανθρώπινη εποπτεία, το γνωστό πλέον στην κοινότητα ως «AI slop».

Η ποινή εφαρμόζεται όταν εντοπίζονται αδιάσειστα στοιχεία, όπως κατασκευασμένες παραπομπές και αυτοματοποιημένα μηνύματα των LLM, ενώ οι παραβάτες θα πρέπει στη συνέχεια να περνούν τις μελλοντικές τους δημοσιεύσεις αποκλειστικά μέσω εγκεκριμένων διαδικασιών peer-review.

Τα «αδιάσειστα στοιχεία» και ο μηχανισμός ελέγχου

Ο Thomas G. Dietterich, ομότιμος καθηγητής Επιστήμης Υπολογιστών στο Πανεπιστήμιο του Όρεγκον και σημερινός πρόεδρος του τμήματος Computer Science (CS) του arXiv, υπήρξε ξεκάθαρος στην τοποθέτησή του μέσω του X. Σύμφωνα με τον ίδιο, η ποινή ενεργοποιείται όταν υπάρχουν «αδιάσειστα στοιχεία» ότι οι ερευνητές δεν έλεγξαν ούτε στο ελάχιστο τα αποτελέσματα που παρήγαγαν τα γλωσσικά μοντέλα.

Τι συνιστά όμως «αδιάσειστο στοιχείο» στη σύγχρονη έρευνα; Τα παραδείγματα που αναφέρθηκαν είναι εξόχως χαρακτηριστικά του φαινομένου. Ακαδημαϊκά άρθρα εντοπίζονται να περιέχουν μετα-σχόλια (meta-comments) των LLMs ενσωματωμένα μέσα στο κυρίως κείμενο. Φράσεις όπως «Here is a 200-word summary; would you like me to make any changes?» (Ακολουθεί μια σύνοψη 200 λέξεων, θέλετε να κάνω κάποιες αλλαγές;) ή «The data in this table is illustrative, fill it in with the real numbers from your experiments» (Τα δεδομένα σε αυτόν τον πίνακα είναι ενδεικτικά, συμπληρώστε τα με τους πραγματικούς αριθμούς από τα πειράματά σας) αφήνονται αυτούσιες μέσα στα έγγραφα PDF που υποβάλλονται. Η ύπαρξη αυτών των φράσεων αποδεικνύει την παντελή απουσία copyediting. Επιπλέον, το σοβαρότερο ζήτημα εντοπίζεται στις «παραισθήσεις» παραπομπών. Λόγω του στοχαστικού τους χαρακτήρα, τα γλωσσικά μοντέλα συχνά «εφευρίσκουν» ονόματα ερευνητών, τίτλους papers και αριθμούς DOI (Digital Object Identifier) που δεν υφίστανται στην πραγματικότητα, αλλοιώνοντας ανεπανόρθωτα την αξιοπιστία της επιστημονικής βιβλιογραφίας.

Από το ICLR 2026 στην κρίση του Νοεμβρίου

Η συγκεκριμένη απόφαση δεν πάρθηκε τυχαία, καθώς το οικοσύστημα της ακαδημαϊκής δημοσίευσης δέχεται τεράστια πίεση. Ήδη από τον Νοέμβριο του 2025, το arXiv αναγκάστηκε να θέσει προσωρινά εκτός λειτουργίας ολόκληρο το τμήμα ελέγχου του Computer Science. Η πλατφόρμα αδυνατούσε να ανταπεξέλθει στον τεράστιο όγκο υποβολών που είχαν δημιουργηθεί με χρήση τεχνητής νοημοσύνης και οι οποίες, στην συντριπτική τους πλειοψηφία, δεν εισήγαγαν απολύτως κανένα νέο επιστημονικό αποτέλεσμα, παρά μόνο αναμασούσαν ήδη υπάρχουσα γνώση προκαλώντας πληροφοριακό θόρυβο.

Το μέγεθος του προβλήματος έγινε ακόμα πιο σαφές στις αρχές του 2026, κατά τη διάρκεια της προετοιμασίας του International Conference on Learning Representations (ICLR), ενός εκ των κορυφαίων συνεδρίων Τεχνητής Νοημοσύνης παγκοσμίως. Τα στατιστικά στοιχεία έδειξαν ότι το 21% των επίσημων κριτικών (peer reviews) του συνεδρίου είχε γραφτεί εξ ολοκλήρου από συστήματα AI, ενώ πάνω από τις μισές κριτικές έδειχναν ξεκάθαρα σημάδια χρήσης αλγορίθμων υποβοήθησης. Η ανατροφοδότηση του συστήματος (AI που αξιολογεί AI έρευνες) οδηγεί σε μια ατέρμονη ανακύκλωση μετριοκρατίας, καθιστώντας την αυστηροποίηση των κανόνων μονόδρομο.

Η αντίδραση της επιστημονικής κοινότητας

Η απόφαση έχει διχάσει την παγκόσμια ακαδημαϊκή κοινότητα. Διακεκριμένοι ερευνητές, όπως ο Ash Jogalekar, senior program manager του τμήματος agentic AI for science της Microsoft, υποδέχτηκαν θετικά την κίνηση. Υποστηρίζουν ότι η αξίωση υψηλών προτύπων από τους επιστήμονες και η απαίτηση για εξονυχιστικό έλεγχο των αποτελεσμάτων του AI πριν τη δημοσίευση είναι απλώς η βασική προϋπόθεση για τη σωστή επιστήμη. Παρομοίως, ο Lucas Beyer, πρώην ερευνητής της OpenAI και νυν της Meta, χαρακτήρισε τους περιορισμούς «εξαιρετικούς» και ζήτησε την αυστηρή επιβολή τους.

Από την άλλη πλευρά, εκφράζονται σοβαρές ανησυχίες. Ορισμένοι ακαδημαϊκοί τονίζουν ότι η αποκλειστική εξάρτηση από αυτοματοποιημένα εργαλεία ανίχνευσης κειμένου AI ελλοχεύει τεράστιους κινδύνους. Τα εργαλεία αυτά παρουσιάζουν συχνά ψευδώς θετικά αποτελέσματα, ειδικά σε κείμενα επιστημόνων των οποίων η μητρική γλώσσα δεν είναι τα αγγλικά, καθώς η γραφή τους τείνει να είναι πιο τυποποιημένη και δομημένη, προσομοιάζοντας συχνά τη στατιστική κανονικότητα των LLMs. Επιπρόσθετα, εγείρονται νομικά και ηθικά ερωτήματα σχετικά με τις περιπτώσεις όπου το AI προσθέτει ως συν-συγγραφείς υπαρκτούς ερευνητές εν αγνοία τους, με τον Dietterich να μην έχει ακόμη αποσαφηνίσει πλήρως πώς θα προστατεύονται τα ονόματα αυτά από άδικους αποκλεισμούς.

*Μπορείτε πλέον να προσθέσετε το Techgear.gr ως Προτιμώμενη Πηγή ενημέρωσης για τις αναζητήσεις σας στο Google Search!

Attention @arxiv authors: Our Code of Conduct states that by signing your name as an author of a paper, each author takes full responsibility for all its contents, irrespective of how the contents were generated. 1/
— Thomas G. Dietterich (@tdietterich) May 14, 2026