Gemini 2.5 Deep Think: Το νέο AI μοντέλο ξεπερνά τα o3 και Grok 4
Η Google ανακοίνωσε επίσημα την κυκλοφορία του νέου μοντέλου τεχνητής νοημοσύνης Gemini 2.5 Deep Think, διαθέσιμου στην εφαρμογή Gemini για συνδρομητές του πακέτου Google AI Ultra. Σύμφωνα με την εταιρεία, το νέο μοντέλο ξεπερνά σε απόδοση τους ανταγωνιστές του, όπως το o3 της OpenAI και το Grok 4 της xAI, σε σειρά από απαιτητικά benchmarks.
Η πρώτη αναφορά στο Deep Think έγινε τον Μάιο, στο πλαίσιο του Google I/O 2025, όταν η Google παρουσίασε την έκδοση Gemini 2.5 Pro με δυνατότητες προηγμένης λογικής ανάλυσης. Το βασικό της χαρακτηριστικό ήταν η ικανότητα να εξετάζει πολλαπλές υποθέσεις ταυτόχρονα πριν καταλήξει σε απάντηση. Η σημερινή ανακοίνωση φέρνει την τελική, αναβαθμισμένη εκδοχή του Deep Think, η οποία έχει βελτιωθεί σημαντικά χάρη σε ανατροφοδότηση από δοκιμαστές και πρόσφατες επιστημονικές εξελίξεις.
Ένα ακόμη ενδιαφέρον στοιχείο που αποκαλύφθηκε είναι ότι το νέο μοντέλο βασίζεται σε μια παραλλαγή της έκδοσης που εξασφάλισε πρόσφατα το χρυσό μετάλλιο στην Παγκόσμια Ολυμπιάδα Μαθηματικών (IMO) του 2025. Ωστόσο, η έκδοση που κυκλοφορεί για καθημερινή χρήση έχει τροποποιηθεί ώστε να λειτουργεί ταχύτερα και πιο αποδοτικά σε καθημερινά σενάρια, γεγονός που την καθιστά λιγότερο ισχυρή από την αμιγώς διαγωνιστική εκδοχή. Ως αποτέλεσμα, αγγίζει επίπεδο απόδοσης αντίστοιχο του χάλκινου μεταλλίου στο IMO benchmark.
Σύμφωνα με τα επίσημα αποτελέσματα από δοκιμές επιδόσεων, το Gemini 2.5 Deep Think πέτυχε εξαιρετικά σκορ σε τέσσερις διαφορετικές πλατφόρμες αξιολόγησης: LiveCodeBench V6, Humanity’s Last Exam (HLE), IMO 2025 και AIME 2025. Τα αποτελέσματα αυτά καταδεικνύουν την ευελιξία και τη δύναμη του μοντέλου σε τομείς όπως η προγραμματιστική επίλυση προβλημάτων, η λογική σκέψη και η κατανόηση επιστημονικών εννοιών.
Οι χρήστες που διαθέτουν συνδρομή Google AI Ultra έχουν πλέον τη δυνατότητα να ενεργοποιήσουν το Deep Think μέσω της εφαρμογής Gemini. Η πρόσβαση είναι περιορισμένη σε συγκεκριμένο αριθμό καθημερινών prompts, τα οποία ενεργοποιούνται μέσω της επιλογής "Deep Think" όταν επιλέγεται το μοντέλο Gemini 2.5 Pro. Η Google ανέφερε ότι το Deep Think συνεργάζεται αυτόματα με βασικά εργαλεία όπως η εκτέλεση κώδικα και η αναζήτηση Google, προσφέροντας ένα πιο ολοκληρωμένο πλαίσιο υποστήριξης για περίπλοκα ερωτήματα.
Παράλληλα, η εταιρεία σχεδιάζει να διαθέσει το Deep Think – τόσο στην εκδοχή με εργαλεία όσο και χωρίς – σε μια επιλεγμένη ομάδα αξιόπιστων developers μέσω του Gemini API, με σκοπό να μελετήσει περαιτέρω τρόπους αξιοποίησης του μοντέλου σε διαφορετικά σενάρια ανάπτυξης.
[via]
Διαβάστε επίσης


