Επίσημο: Η OpenAI παρουσίασε το GPT-5.6 Sol έναντι του Claude Mythos 5

Add as preferred source on Google

Σύνοψη

  • Η OpenAI ανακοίνωσε επίσημα τη νέα γενιά μοντέλων τεχνητής νοημοσύνης GPT-5.6, η οποία χωρίζεται σε τρεις βαθμίδες: Sol (Ναυαρχίδα), Terra (Εξισορροπημένο) και Luna (Υψηλή ταχύτητα / Χαμηλό κόστος).
  • Το κορυφαίο μοντέλο, GPT-5.6 Sol, καταγράφει νέο ρεκόρ απόδοσης 91,9% στο Terminal-Bench 2.1, ξεπερνώντας το Claude Mythos 5 της Anthropic.
  • Εισάγεται η νέα λειτουργία «Ultra», η οποία χρησιμοποιεί πολλαπλούς υποπράκτορες (subagents) για την παράλληλη επίλυση εξαιρετικά σύνθετων προβλημάτων.
  • Οι τιμές ξεκινούν από τα 5 δολάρια (~4,60€) ανά εκατομμύριο input tokens για το Sol, με υποστήριξη prompt caching ελάχιστης διάρκειας 30 λεπτών.
  • Η αρχική διάθεση αφορά ένα αυστηρά κλειστό κύκλο συνεργατών, έπειτα από άμεση παρέμβαση και περιορισμούς που έθεσε η κυβέρνηση των ΗΠΑ.
  • Τον Ιούλιο του 2026, το GPT-5.6 Sol θα τρέχει στο hardware της Cerebras, αγγίζοντας ταχύτητες επεξεργασίας που φτάνουν τα 750 tokens ανά δευτερόλεπτο.

Η OpenAI προχώρησε στα αποκαλυπτήρια της νέας γενιάς παραγωγικών μοντέλων της, παρουσιάζοντας επίσημα την οικογένεια GPT-5.6. Εγκαταλείποντας την παραδοσιακή της ονοματολογία, η εταιρεία εισάγει τα μοντέλα Sol, Terra και Luna, καθένα από τα οποία στοχεύει σε διαφορετικές υπολογιστικές ανάγκες και προϋπολογισμούς. Η αρχιτεκτονική του νέου συστήματος εστιάζει στην εντατική ικανότητα συλλογισμού, την αυτόνομη εκτέλεση κώδικα και την ενισχυμένη ασφάλεια απέναντι σε κυβερνοεπιθέσεις.

Ποια είναι τα χαρακτηριστικά και οι επιδόσεις του GPT-5.6 Sol;

Το GPT-5.6 Sol αποτελεί τη νέα ναυαρχίδα της OpenAI, φέρνοντας την προηγμένη λειτουργία «Ultra» που χρησιμοποιεί αυτόνομους υποπράκτορες (subagents) για σύνθετους υπολογισμούς. Με βαθμολογία 91,9% στο Terminal-Bench 2.1, το Sol ξεπερνά επισήμως το Claude Mythos 5 της Anthropic, προσφέροντας κορυφαίες επιδόσεις σε προγραμματισμό, βιολογία και κυβερνοασφάλεια με βελτιστοποιημένη κατανάλωση πόρων.

Βασικά χαρακτηριστικά

  • Terminal-Bench 2.1: Βαθμολογία 91,9% (Sol Ultra) έναντι 84,3% του Claude Mythos 5.
  • Μοντέλα ενδιάμεσης κατηγορίας: Το GPT-5.6 Terra προσφέρει επιδόσεις επιπέδου GPT-5.5 στο μισό κόστος.
  • Νέες λειτουργίες: Ενσωμάτωση επιλογής «Max Reasoning» για παροχή επιπλέον υπολογιστικού χρόνου πριν την παραγωγή της απάντησης.

Το Terminal-Bench 2.1 αξιολογεί την ικανότητα ενός AI να εκτελεί ροές εργασίας απευθείας από το command-line, απαιτώντας σχεδιασμό, συνεχείς δοκιμές και συντονισμό εργαλείων. Τα δεδομένα της OpenAI δείχνουν ότι η έκδοση GPT-5.6 Sol (χωρίς το Ultra mode) επιτυγχάνει 88,8%, αφήνοντας πίσω τον ανταγωνισμό. Παράλληλα, στο GeneBench v1, το οποίο αφορά την αναζήτηση και ανάλυση ποσοτικής βιολογίας, το νέο μοντέλο παράγει ακριβέστερα αποτελέσματα χρησιμοποιώντας αισθητά λιγότερα tokens συγκριτικά με τον προκάτοχό του (GPT-5.5). Στον τομέα της κυβερνοασφάλειας και συγκεκριμένα στο ExploitBench², το Sol κρίνεται άκρως ανταγωνιστικό του Mythos Preview, λειτουργώντας στο 1/3 της κατανάλωσης output tokens.

Διαθεσιμότητα

Η σειρά GPT-5.6 είναι διαθέσιμη σε τρεις βαθμίδες κόστους. Το κορυφαίο Sol κοστολογείται στα 5 δολάρια (περίπου 4,60€) ανά 1M input tokens και 30 δολάρια (27,60€) για τα output. Παράλληλα, η εταιρεία εισάγει την τεχνολογία prompt caching με εγγυημένη ελάχιστη διάρκεια 30 λεπτών, στοιχείο που μειώνει δραστικά τα λειτουργικά έξοδα για τις τοπικές επιχειρήσεις που διαχειρίζονται επαναλαμβανόμενες κλήσεις στο API.

Αναλυτικότερα, το κοστολόγιο διαμορφώνεται ως εξής για τους developers και τα εταιρικά σχήματα που επιθυμούν να το ενσωματώσουν:

  • GPT-5.6 Sol: 5$ (~4,60€) ανά 1M input tokens | 30$ (~27,60€) ανά 1M output tokens.
  • GPT-5.6 Terra: 2,50$ (~2,30€) ανά 1M input tokens | 15$ (~13,80€) ανά 1M output tokens.
  • GPT-5.6 Luna: 1$ (~0,92€) ανά 1M input tokens | 6$ (~5,50€) ανά 1M output tokens.

Η διάθεση της οικογένειας GPT-5.6 δεν ξεκινά με ανοιχτή πρόσβαση στο ευρύ κοινό, αλλά μέσω ενός εξαιρετικά περιορισμένου προγράμματος για στενούς συνεργάτες. Σύμφωνα με την επίσημη ανακοίνωση της OpenAI, η συγκεκριμένη απόφαση ελήφθη κατόπιν άμεσου αιτήματος της κυβέρνησης των ΗΠΑ, η οποία επιθυμεί να αξιολογήσει διεξοδικά τις ικανότητες του μοντέλου σε θέματα κυβερνοασφάλειας, πριν αυτό διατεθεί στην παγκόσμια αγορά.

Η διοίκηση της OpenAI σημείωσε εμφατικά στο επίσημο blog post της πως δεν συμφωνεί με τη μονιμοποίηση τέτοιων κυβερνητικών πρακτικών, υποστηρίζοντας ότι "κρατούν τα καλύτερα εργαλεία μακριά από χρήστες, προγραμματιστές και ειδικούς άμυνας στον κυβερνοχώρο που τα χρειάζονται".

Προκειμένου να θωρακίσει το GPT-5.6, η OpenAI κατανάλωσε περισσότερες από 700.000 ώρες επεξεργαστικού χρόνου σε GPUs επιπέδου A100 (A100-equivalent hours) αποκλειστικά για αυτοματοποιημένο "red-teaming". Το σύστημα ελέγχεται ενδελεχώς για universal jailbreaks—επιθέσεις που διαπερνούν τους αλγορίθμους ασφαλείας ανεξαρτήτως του context της συνομιλίας.

Το αμυντικό στρώμα του GPT-5.6 περιλαμβάνει ενσωματωμένη άρνηση εκτέλεσης επιβλαβούς κώδικα (ακόμα και όταν ο χρήστης προσπαθεί να καμουφλάρει την πρόθεση του), classifiers πραγματικού χρόνου που αναλύουν τα δεδομένα καθώς παράγονται και account-level ελέγχους, οι οποίοι εξετάζουν το συνολικό ιστορικό ενός λογαριασμού για να εντοπίσουν επαναλαμβανόμενες, ύποπτες συμπεριφορές έναντι της νόμιμης έρευνας ευπαθειών.

Loading