OpenAI: Σημαντικές αναβαθμίσεις για το AI εργαλείο προγραμματισμού Codex

Η OpenAI, πέρα από τη διαχείριση της δημοφιλούς πλατφόρμας ChatGPT που εξυπηρετεί εκατοντάδες εκατομμύρια χρήστες καθημερινά, αποτελεί και βασικό σημείο αναφοράς για προγραμματιστές που αναπτύσσουν εφαρμογές τεχνητής νοημοσύνης. Ο συνδυασμός προηγμένων μοντέλων και εύχρηστων εργαλείων καθιστά την εταιρεία πόλο έλξης για την παγκόσμια κοινότητα των developers.

Σε αυτό το πλαίσιο, η OpenAI ανακοίνωσε δύο σημαντικές αναβαθμίσεις που αφορούν τη χρήση της πλατφόρμας από προγραμματιστές. Η πρώτη αφορά το Codex, τον βοηθό λογισμικού για προγραμματιστές, ο οποίος πλέον είναι διαθέσιμος και στους συνδρομητές ChatGPT Plus. Για περιορισμένο χρονικό διάστημα, οι χρήστες αυτοί θα μπορούν να απολαμβάνουν γενναιόδωρα όρια χρήσης, αν και αυτά ενδέχεται να περιορίζονται σε περιόδους υψηλής ζήτησης.

Το Codex αποκτά πλέον τη δυνατότητα σύνδεσης με το διαδίκτυο για την εγκατάσταση kits, την αναβάθμιση πακέτων, την εκτέλεση δοκιμών που απαιτούν εξωτερικούς πόρους και πολλά άλλα. Αν και η πρόσβαση στο διαδίκτυο είναι απενεργοποιημένη από προεπιλογή, οι χρήστες μπορούν να την ενεργοποιούν επιλεκτικά, καθορίζοντας ακόμη και συγκεκριμένα domains προς πρόσβαση. Η νέα αυτή δυνατότητα είναι άμεσα διαθέσιμη στους χρήστες ChatGPT Plus, Pro και Teams, ενώ σύντομα θα διατεθεί και στους χρήστες Enterprise.

Μεταξύ των νέων λειτουργιών του Codex, περιλαμβάνεται η δυνατότητα ενημέρωσης υφιστάμενων pull requests όταν ένα task προχωρά σε επόμενο στάδιο, καθώς και η υπαγόρευση εντολών μέσω φωνής, κάτι που καθιστά την αλληλεπίδραση ακόμη πιο ευέλικτη.

Η OpenAI παρουσίασε επίσης σειρά τεχνικών βελτιώσεων για το Codex:

  • Υποστήριξη για binary αρχεία, τόσο κατά την εφαρμογή patches όσο και σε pull requests (με δυνατότητα διαγραφής ή μετονομασίας).
  • Πιο κατανοητά μηνύματα σφαλμάτων για σενάρια εγκατάστασης.
  • Αύξηση του ορίου διαφοράς εργασιών από 1 MB σε 5 MB.
  • Διπλασιασμός της διάρκειας των setup scripts σε 10 λεπτά.
  • Βελτιώσεις στη σύνδεση με GitHub.
  • Επανενεργοποίηση των Live Activities σε iOS.
  • Απλοποίηση του ελέγχου ταυτότητας για όσους συνδέονται με SSO ή κοινωνικούς λογαριασμούς, με κατάργηση της απαίτησης για υποχρεωτικό two-factor authentication.

Η δεύτερη σημαντική ανακοίνωση αφορά τους voice agents. Η OpenAI παρουσίασε επίσημα το νέο Agents SDK σε TypeScript, ενισχυμένο με λειτουργίες όπως handoffs, guardrails, tracing και υποστήριξη για MCP. Το SDK περιλαμβάνει επίσης δυνατότητα ελέγχου από τον χρήστη μέσω human-in-the-loop approvals, επιτρέποντας παύση της εκτέλεσης ενός εργαλείου, αποθήκευση της κατάστασης του agent, έγκριση ή απόρριψη επιμέρους ενεργειών και επανεκκίνηση της διαδικασίας.

Παράλληλα, παρουσιάστηκε νέο speech-to-speech μοντέλο, με σημαντικές βελτιώσεις στην ακρίβεια εκτέλεσης οδηγιών, την αξιοπιστία των εργαλείων και την ανταπόκριση σε διακοπές κατά τη διάρκεια της συνομιλίας. Οι developers έχουν πλέον τη δυνατότητα να ρυθμίζουν τη φωνητική ταχύτητα ανά session, προσαρμόζοντας έτσι τη συμπεριφορά του agent ανάλογα με τη χρήση.

Το νέο μοντέλο είναι διαθέσιμο μέσω των gpt-4o-realtime-preview-2025-06-03 και gpt-4o-audio-preview-2025-06-03, στις πλατφόρμες Realtime API και Chat Completions API αντίστοιχα.

Τέλος, ο πίνακας Traces επεκτείνεται ώστε να υποστηρίζει και τα Realtime API sessions, επιτρέποντας στους προγραμματιστές να οπτικοποιούν με ακρίβεια κάθε βήμα της αλληλεπίδρασης με τον voice agent, συμπεριλαμβανομένων των ηχητικών εισόδων/εξόδων, των ενεργοποιήσεων εργαλείων και των πιθανών διακοπών.

[via]

Loading