GPT-5-Codex: Το νέο «όπλο» της OpenAI για αυτόνομο προγραμματισμό

Λίγες μόλις εβδομάδες μετά την παρουσίαση του GPT-5, του πιο εξελιγμένου μοντέλου τεχνητής νοημοσύνης που έχει κυκλοφορήσει μέχρι σήμερα, η OpenAI επιστρέφει με μια νέα παραλλαγή, ειδικά προσαρμοσμένη για τον κόσμο του λογισμικού. Πρόκειται για το GPT-5-Codex, ένα μοντέλο σχεδιασμένο να ενισχύει τις δυνατότητες της πλατφόρμας Codex με στόχο τον αυτόνομο, πρακτικό προγραμματισμό.

Η OpenAI είχε υποσχεθεί ότι το GPT-5 θα εστιάσει στην ενίσχυση της «agentic» διάστασης, δηλαδή στη δυνατότητα να αναλαμβάνει πρωτοβουλίες, να σκέφτεται στρατηγικά και να εκτελεί εργασίες με μεγαλύτερη αυτονομία. Τα πρώτα benchmarks το επιβεβαίωσαν: 74,9% στο SWE-bench Verified και 88% στο Aider Polyglot, επιδόσεις που υπογράμμισαν το βήμα προόδου. Με το GPT-5-Codex, η εταιρεία κάνει το επόμενο βήμα, στοχεύοντας πιο συγκεκριμένα στον χώρο της μηχανικής λογισμικού.

Το νέο μοντέλο έχει αναπτυχθεί με σκοπό να ανταποκρίνεται καλύτερα σε πραγματικές συνθήκες ανάπτυξης λογισμικού. Δεν περιορίζεται στη συγγραφή κώδικα, αλλά μπορεί να δημιουργήσει έργα από το μηδέν, να προσθέσει νέες λειτουργίες και tests σε υπάρχοντα projects, να αναλάβει μεγάλης κλίμακας refactoring και πολλά ακόμα. Ουσιαστικά, πρόκειται για ένα εργαλείο που προσεγγίζει ολοένα και περισσότερο τον ρόλο ενός αυτόνομου συνεργάτη σε μια ομάδα ανάπτυξης.

Τα νούμερα μιλούν από μόνα τους. Στα benchmarks του SWE-bench Verified, το GPT-5 High κατέγραψε 72,8%, ενώ το GPT-5-Codex ανέβηκε στο 74,5%. Ακόμα πιο εντυπωσιακά είναι τα αποτελέσματα στο code refactoring, όπου το νέο μοντέλο έφτασε το 51,3%, έναντι μόλις 33,9% του απλού GPT-5. Οι αριθμοί δείχνουν ότι η εξειδίκευση αποδίδει και ότι το GPT-5-Codex έχει σαφές πλεονέκτημα σε σύνθετες εργασίες καθαρισμού και αναδόμησης κώδικα.

Μια από τις πιο καινοτόμες δυνατότητες του GPT-5-Codex είναι η προσαρμοστικότητα στον χρόνο σκέψης. Το μοντέλο αποφασίζει μόνο του πόσο χρόνο θα αφιερώσει σε μια εργασία, ανάλογα με την πολυπλοκότητά της. Στις εσωτερικές δοκιμές της OpenAI, το GPT-5-Codex εργάστηκε αυτόνομα για περισσότερες από επτά ώρες σε μεγάλα, πολύπλοκα projects, χωρίς ανθρώπινη παρέμβαση. Η συμπεριφορά αυτή το φέρνει ένα βήμα πιο κοντά σε αυτό που πολλοί φαντάζονται ως πραγματικό «ψηφιακό συνεργάτη».

Οι βελτιώσεις δεν περιορίζονται στο backend. Το GPT-5-Codex παρουσιάζει αισθητά καλύτερες επιδόσεις και σε εργασίες front-end, όπως η δημιουργία mobile websites. Επιπλέον, μπορεί να δεχτεί εικόνες ως είσοδο στο cloud, να αξιολογήσει οπτικά την πρόοδο και να δημιουργήσει screenshots για να δείξει το αποτέλεσμα. Αυτό σημαίνει ότι το μοντέλο δεν δουλεύει πλέον «στα τυφλά», αλλά μπορεί να ελέγχει και να επιδεικνύει οπτικά όσα ολοκληρώνει.

Ένα άλλο ισχυρό πλεονέκτημα είναι οι ικανότητες του στον έλεγχο του κώδικα. Το GPT-5-Codex δεν περιορίζεται σε απλή αναγνώριση συντακτικών λαθών· μπορεί να συγκρίνει το νόημα ενός pull request με το diff που περιέχει, να αξιολογήσει ολόκληρη τη βάση κώδικα, ακόμα και να εκτελέσει δοκιμές για να διασφαλίσει ότι οι αλλαγές λειτουργούν όπως προβλέπεται. Η OpenAI μάλιστα δηλώνει ότι έχει ήδη ενσωματώσει το GPT-5-Codex στις δικές της εσωτερικές διαδικασίες code review, όπου εντοπίζει καθημερινά εκατοντάδες ζητήματα που διαφορετικά θα ξέφευγαν από το ανθρώπινο μάτι.

Η διάθεση του νέου μοντέλου γίνεται μέσα από όλες τις βασικές υπηρεσίες της OpenAI. Το GPT-5-Codex είναι πλέον προσβάσιμο σε συνδρομητές των πακέτων ChatGPT Plus, Pro, Business, Edu και Enterprise, μέσω του Codex CLI, του IDE Extension, της web και mobile εφαρμογής, καθώς και για code reviews στο GitHub. Παράλληλα, για όσους χρησιμοποιούν το Codex CLI με API key, η εταιρεία προανήγγειλε ότι το μοντέλο θα ενσωματωθεί σύντομα και στο API.

[via]