Η OpenAI παρουσιάζει τα πανίσχυρα συλλογιστικά AI μοντέλα o3 και o4-mini

Η OpenAI ανακοίνωσε σήμερα επίσημα τα νέα μοντέλα τεκμηρίωσης και λογικής σκέψης o3 και o4-mini, τα οποία προσφέρουν κορυφαία απόδοση σε πληθώρα γνωστών benchmarks τεχνητής νοημοσύνης. Πρόκειται για ένα σημαντικό βήμα στην εξέλιξη των γλωσσικών μοντέλων, καθώς για πρώτη φορά μπορούν να έχουν πρόσβαση σε εξωτερικά εργαλεία, όπως web browserPython interpreter, και άλλα.

Σύμφωνα με την OpenAI, τα νέα AI μοντέλα εκπαιδεύτηκαν έτσι ώστε να κατανοούν πότε και πώς να χρησιμοποιούν εργαλεία, προκειμένου να δώσουν πιο ακριβείς και χρήσιμες απαντήσεις, προσαρμοσμένες στο πλαίσιο του εκάστοτε αιτήματος. Αυτό επιτρέπει στους χρήστες να απολαμβάνουν σημαντικά καλύτερη απόδοση σε λογικά και σύνθετα ερωτήματα σε σχέση με προηγούμενες εκδόσεις.

Το ισχυρότερο μοντέλο της OpenAI μέχρι σήμερα: o3

Το OpenAI o3 χαρακτηρίζεται ως το πιο ισχυρό συλλογιστικό μοντέλο της εταιρείας έως σήμερα, επιτυγχάνοντας νέα ρεκόρ απόδοσης σε πλατφόρμες όπως το Codeforces, το SWE-bench και το MMMU. Το μοντέλο υποστηρίζει ανέβασμα εικόνων, επιτρέποντας έτσι στους χρήστες να το αξιοποιούν για ανάλυση γραφημάτων, φωτογραφιών και διαγραμμάτων.

Εξωτερικοί αξιολογητές επισημαίνουν ότι το o3 διαπράττει 20% λιγότερα σοβαρά λάθη σε περίπλοκες, ρεαλιστικές εργασίες σε σύγκριση με το προηγούμενο μοντέλο o1, προσφέροντας πιο αξιόπιστα αποτελέσματα.

Το μικρό αλλά ισχυρό o4-mini

Το o4-mini είναι ένα μικρότερο και πιο αποδοτικό μοντέλο που έχει σχεδιαστεί για ταχύτητα και χαμηλό κόστος λειτουργίας, χωρίς να θυσιάζει την ποιότητα. Παρότι πιο ελαφρύ, αγγίζει την απόδοση του o3 σε μαθηματικά, προγραμματισμό και οπτικές εργασίες. Για παράδειγμα, σε αξιολόγηση AIME 2025, το o4-mini σημείωσε ποσοστό επιτυχίας 99,5% όταν συνδυάστηκε με τον διερμηνέα Python.

Η αποδοτικότητά του σημαίνει πως οι χρήστες θα μπορούν να έχουν πολύ υψηλότερα όρια χρήσης, γεγονός που καθιστά το o4-mini ιδανικό για περιπτώσεις μαζικής χρήσης σε καθημερινές εφαρμογές.

Ενισχυμένη μνήμη, φυσική ροή διαλόγου και περισσότερα εργαλεία

Τα νέα μοντέλα προσφέρουν βελτιωμένη φυσικότητα στις συνομιλίες, καθώς είναι σε θέση να αναφέρονται σε προηγούμενες αλληλεπιδράσεις και να διατηρούν «μνήμη» στο διάλογο. Εκπαιδεύτηκαν με ενισχυτική μάθηση μεγάλης κλίμακας ώστε να αξιοποιούν εργαλεία με έξυπνο και αποδοτικό τρόπο.

Σε σχέση με τα προηγούμενα μοντέλα, η σχέση κόστους-απόδοσης είναι αισθητά βελτιωμένη. Η OpenAI διαβεβαιώνει ότι τόσο το o3 όσο και το o4-mini παραμένουν κάτω από τα όρια "υψηλού κινδύνου" σε όλες τις κατηγορίες του Πλαισίου Ασφαλείας της.

Νέες δυνατότητες για προγραμματιστές: Codex CLI και API εξελίξεις

Η OpenAI παρουσίασε επίσης το Codex CLI, έναν ελαφρύ προγραμματιστικό βοηθό που λειτουργεί απευθείας από τον υπολογιστή του χρήστη, προσφέροντας μια νέα εμπειρία γραμμής εντολών για προγραμματιστές.

Παράλληλα, η εταιρεία ξεκινά ένα πρόγραμμα χρηματοδότησης 1 εκατομμυρίου δολαρίων, υποστηρίζοντας έργα που αξιοποιούν το Codex CLI και τα νέα μοντέλα o3 και o4.

Οι νέες εκδόσεις είναι ήδη διαθέσιμες μέσω του ChatGPT για χρήστες Plus, Pro και Team, αντικαθιστώντας τα παλαιότερα μοντέλα o1, o3-mini και o3-mini-high. Οι Enterprise και Edu χρήστες θα αποκτήσουν πρόσβαση μέσα στην επόμενη εβδομάδα. Οι χρήστες της δωρεάν έκδοσης ChatGPT μπορούν να δοκιμάσουν το o4-mini επιλέγοντας το mode "Think" στον συνθέτη κειμένου.

Κόστος και διαθεσιμότητα

Το κόστος του μοντέλου o3 ανέρχεται στα $10 ανά εκατομμύριο εισερχόμενων tokens και $40 ανά εκατομμύριο εξερχόμενων. Αντίστοιχα, το o4-mini διατηρεί την τιμολόγηση του προκατόχου του o3-mini: $1.10 ανά εκατομμύριο εισόδων και $4.40 ανά εκατομμύριο εξόδων.

Οι προγραμματιστές έχουν άμεση πρόσβαση στα μοντέλα μέσω των Chat Completions API και Responses API. Το τελευταίο υποστηρίζει πλέον λογικές περιλήψεις και διατήρηση tokens γύρω από κλήσεις συναρτήσεων, για ακόμα καλύτερη απόδοση.

Τέλος, σύντομα θα προστεθεί υποστήριξη για εργαλεία πρώτου μέρους, όπως αναζήτηση στο διαδίκτυο, αναζήτηση αρχείων και διερμηνέας κώδικα, πλήρως ενσωματωμένα στην αλυσίδα λογικής του κάθε μοντέλου.

[via]

Loading