Έρευνα: Το ChatGPT αυξάνει τους βαθμούς, αλλά μειώνει τη μάθηση

Σύνοψη

Αύξηση κατά 13 ποσοστιαίες μονάδες (ή 30%) στους βαθμούς "Άριστα" μετά την κυκλοφορία του ChatGPT, βάσει ανάλυσης 500.000 ακαδημαϊκών βαθμολογιών.
Μείωση της πραγματικής απόδοσης κατά 17% σε εξετάσεις χωρίς τη χρήση AI, καθώς τα συστήματα λειτουργούν ως μαθησιακό «δεκανίκι».
Ενσωμάτωση εκπαιδευτικών δικλείδων ασφαλείας: Τα AI chatbots αποτρέπουν την πτώση της μάθησης μόνο όταν δίνουν στοχευμένες υποδείξεις και όχι έτοιμες απαντήσεις.
Άμεση ανάγκη αναθεώρησης του συστήματος αξιολόγησης στα ακαδημαϊκά ιδρύματα, με έμφαση στην κριτική σκέψη εντός αιθούσης.

Η ενσωμάτωση της παραγωγικής Τεχνητής Νοημοσύνης στην ακαδημαϊκή καθημερινότητα παρουσιάζει μια οξύμωρη πραγματικότητα: τα συστήματα αυτά αυξάνουν ραγδαία τους μέσους όρους των βαθμολογιών, αλλά ταυτόχρονα διαβρώνουν τη θεμελιώδη ικανότητα των φοιτητών να κατανοούν και να επιλύουν σύνθετα προβλήματα αυτόνομα. Αυτό το συμπέρασμα δεν προκύπτει από εμπειρικές εικασίες, αλλά τεκμηριώνεται πλέον από δύο εκτενείς και ανεξάρτητες ακαδημαϊκές έρευνες που δημοσιεύθηκαν προσφάτως, ανατρέποντας το αφήγημα πως η Τεχνητή Νοημοσύνη θα αποτελέσει από μόνη της τον απόλυτο επιταχυντή της εκπαίδευσης.

Από το Πανεπιστήμιο της Πενσυλβάνια έως το Πανεπιστήμιο της Καλιφόρνια (Berkeley), τα ερευνητικά δεδομένα υποδεικνύουν την ύπαρξη ενός «εκπαιδευτικού πληθωρισμού». Οι αλγόριθμοι αναλαμβάνουν το γνωστικό φορτίο που ιστορικά ανήκε στον μαθητή, μετατρέποντας τη διαδικασία της μάθησης από ενεργή εξερεύνηση σε παθητική κατανάλωση έτοιμων αποτελεσμάτων.

Η έρευνα του eScholarship: Η πληθωριστική τάση των βαθμών

Το Κέντρο Μελετών Ανώτατης Εκπαίδευσης του UC Berkeley δημοσίευσε τη μελέτη του Igor Chirikov με τίτλο "Artificial Intelligence and Grade Inflation". Τα δεδομένα που αναλύθηκαν προκαλούν προβληματισμό: ερευνήθηκαν περισσότεροι από 500.000 βαθμοί φοιτητών ενός μεγάλου ερευνητικού πανεπιστημίου των ΗΠΑ (Τέξας), συγκρίνοντας την απόδοση πριν και μετά το λανσάρισμα του ChatGPT, με χρονικό ορίζοντα από το 2018 έως το 2025.

Ο ερευνητής διαχώρισε τα μαθήματα σε δύο βασικές κατηγορίες: τα «Ευάλωτα στην AI» (εκείνα που βασίζονται στη συγγραφή κειμένων, δοκιμίων και στον προγραμματισμό) και τα «Ανθεκτικά στην AI» (πρακτικά εργαστήρια, μαθηματικά, φυσική με αυστηρή επίβλεψη). Η ανάλυση κατέγραψε ότι στα ευάλωτα μαθήματα, το ποσοστό των βαθμών "Άριστα" (Α) σημείωσε αύξηση κατά 13 ποσοστιαίες μονάδες, μεταφραζόμενο σε 30% αύξηση σε σχέση με τα δεδομένα του 2022.

Η συγκεκριμένη αύξηση ήταν μάλιστα εντονότερη στα μαθήματα όπου η τελική βαθμολογία βασιζόταν σε μεγάλο βαθμό σε εργασίες για το σπίτι (homework). Όπως επισημαίνεται στην έρευνα, αυτός ο πληθωρισμός δεν αντικατοπτρίζει μια ξαφνική, μαζική γνωστική εξέλιξη του φοιτητικού σώματος, αλλά την ικανότητα των μεγάλων γλωσσικών μοντέλων (LLMs) να εκτελούν άριστα τα παραδοσιακά κριτήρια αξιολόγησης. Το ChatGPT αυξάνει τις επιδόσεις στα χαρτιά, αποκρύπτοντας τα πραγματικά γνωστικά κενά.

Η μελέτη του Πανεπιστημίου της Πενσυλβάνια: Η Τεχνητή Νοημοσύνη ως «δεκανίκι»

Το πρόβλημα της έλλειψης ουσιαστικής μάθησης αναλύεται εις βάθος στη μελέτη της Hamsa Bastani και της ομάδας της ("Generative AI can harm learning"). Η έρευνα εξέτασε μαθητές λυκείου στην κατανόηση μαθηματικών, αξιοποιώντας σχεδόν 1.000 συμμετέχοντες, όπου η πειραματική διαδικασία διαίρεσε τους μαθητές, παρέχοντάς τους πρόσβαση στο μοντέλο GPT-4.

Οι ερευνητές χρησιμοποίησαν δύο παραλλαγές του AI: το "GPT Base" (ένα τυπικό περιβάλλον ChatGPT που παρείχε άμεσα τη λύση του προβλήματος) και το "GPT Tutor" (ένα μοντέλο με δικλείδες ασφαλείας, σχεδιασμένο να λειτουργεί ως δάσκαλος, δίνοντας υποδείξεις και αρνούμενο να αποκαλύψει την τελική απάντηση).

Κατά τη διάρκεια των ασκήσεων με ανοιχτή πρόσβαση στα εργαλεία, η ομάδα του "GPT Base" λύνοντας τα προβλήματα κατέγραψε εξαιρετικές επιδόσεις. Ωστόσο, όταν στους ίδιους μαθητές αφαιρέθηκε η πρόσβαση στην Τεχνητή Νοημοσύνη, παρατηρήθηκε πτώση της απόδοσης τους κατά 17% συγκριτικά με όσους δεν είχαν ποτέ πρόσβαση στο εργαλείο. Σύμφωνα με την Bastani, οι μαθητές χρησιμοποίησαν το AI ως «δεκανίκι», αγνοώντας εντελώς την κριτική διαδικασία της επίλυσης. Το εύρημα αυτό είναι κρίσιμο, διότι υπογραμμίζει πως η άνευ όρων χρήση της παραγωγικής AI μειώνει μακροπρόθεσμα την ικανότητα επεξεργασίας δεδομένων από τον ανθρώπινο εγκέφαλο.

Αντιθέτως, η ομάδα που χρησιμοποίησε το "GPT Tutor" – το σύστημα δηλαδή που τους καθοδηγούσε με υποδείξεις απαιτώντας ενεργή συμμετοχή – διατήρησε την κριτική της σκέψη, αποδεικνύοντας ότι το πρόβλημα δεν εντοπίζεται στην ίδια την τεχνολογία, αλλά στον τρόπο με τον οποίο ενσωματώνεται στο εκπαιδευτικό πλαίσιο.

Οι επιπτώσεις στη διαδικασία εκπαίδευσης και αξιολόγησης

Σε τεστ κατανόησης κειμένου και μαθηματικών πράξεων, οι μαθητές με πρόσβαση σε AI ανέπτυξαν διπλάσιο "skip rate" (ποσοστό παράλειψης ερωτήσεων), επιλέγοντας συνειδητά να μην προσπαθήσουν να απαντήσουν στα δύσκολα σημεία, περιμένοντας τη λύση από τη μηχανή.

Αυτό το μοτίβο μεταβάλλει τη βασική φύση της εκπαίδευσης. Οι βαθμοί, που παραδοσιακά αποτελούν το μέσο επικοινωνίας της ακαδημαϊκής επάρκειας ενός ατόμου, χάνουν πλέον τη σημασιολογική τους αξία. Όταν ένας καθηγητής ή εργοδότης βλέπει έναν βαθμό "Άριστα", δεν μπορεί πλέον να γνωρίζει αν ο υποψήφιος κατέχει τις δεξιότητες προγραμματισμού ή συγγραφής, ή αν απλώς διαθέτει υψηλή ικανότητα συγγραφής εντολών (prompt engineering) στα σύγχρονα μοντέλα τεχνητής νοημοσύνης.

*Μπορείτε πλέον να προσθέσετε το Techgear.gr ως Προτιμώμενη Πηγή ενημέρωσης για τις αναζητήσεις σας στο Google Search!