Gemini Deep Think: Η AI κατακτά χρυσό μετάλλιο στον πιο απαιτητικό διαγωνισμό μαθηματικών στον κόσμο

Μπορεί το πολυαναμενόμενο Deep Think mode του Gemini να μην έχει κυκλοφορήσει ακόμη επίσημα, όμως η Google φροντίζει να κρατά αμείωτο το ενδιαφέρον, αποκαλύπτοντας μία ιδιαίτερα εντυπωσιακή επιτυχία: μια εξελιγμένη εκδοχή του μοντέλου της πέτυχε επίδοση επιπέδου χρυσού μεταλλίου στον πιο απαιτητικό διαγωνισμό μαθηματικών στον κόσμο.

Ο λόγος για την International Mathematical Olympiad (IMO), έναν ετήσιο θεσμό που ξεκίνησε το 1959 και συγκεντρώνει τους καλύτερους νέους μαθηματικούς κάθε χώρας. Κάθε εθνική ομάδα απαρτίζεται από έξι προ-πανεπιστημιακούς μαθητές, οι οποίοι καλούνται να λύσουν έξι εξαιρετικά δύσκολα προβλήματα στους τομείς της άλγεβρας, της συνδυαστικής, της γεωμετρίας και της θεωρίας αριθμών. Περίπου οι μισοί διαγωνιζόμενοι κερδίζουν κάποιο μετάλλιο, ενώ μόλις το 8% καταφέρνει να αποσπάσει χρυσό.

Στον φετινό διαγωνισμό IMO 2025, που πραγματοποιήθηκε την περασμένη εβδομάδα, μια προχωρημένη εκδοχή του Gemini Deep Think κατάφερε να λύσει άψογα τα πέντε από τα έξι προβλήματα, συγκεντρώνοντας 35 βαθμούς και φτάνοντας στο επίπεδο που αντιστοιχεί σε χρυσό μετάλλιο. Η Google δημοσίευσε μάλιστα και τις πλήρεις λύσεις των προβλημάτων σε μορφή PDF, αποδεικνύοντας τη σοβαρότητα της επίδοσης.

Για να φτάσει σε αυτό το επίπεδο απόδοσης, η ομάδα ανάπτυξης ενίσχυσε το Gemini με νέες τεχνικές ενισχυτικής μάθησης, επικεντρωμένες στη σύνθετη λογική, στην απόδειξη θεωρημάτων και στην επίλυση προβλημάτων πολλών βημάτων. Επιπλέον, το μοντέλο εκπαιδεύτηκε πάνω σε μια προσεκτικά επιλεγμένη συλλογή λύσεων μαθηματικών προβλημάτων υψηλού επιπέδου, ενώ του δόθηκαν και γενικές στρατηγικές για την προσέγγιση των απαιτητικών ασκήσεων του διαγωνισμού.

Η Google είχε δηλώσει τον Μάιο ότι η έκδοση 2.5 Pro του Gemini αποτελούσε τη βάση για αυτές τις δυνατότητες. Ωστόσο, στη νέα της ανακοίνωση, αναφέρεται απλώς σε μια "προχωρημένη εκδοχή" του μοντέλου, χωρίς περισσότερες τεχνικές λεπτομέρειες.

Αυτό που κάνει την επίδοση ακόμα πιο εντυπωσιακή είναι ότι το Gemini λειτούργησε εξ ολοκλήρου με φυσική γλώσσα – από την κατανόηση των επίσημων εκφωνήσεων μέχρι την παραγωγή αυστηρών αποδείξεων. Μέσα στα χρονικά όρια του διαγωνισμού (4,5 ώρες), το μοντέλο παρήγαγε λύσεις που θα μπορούσαν να σταθούν σε ακαδημαϊκό επίπεδο, χωρίς ενδιάμεσες μεταφράσεις των προβλημάτων σε εξειδικευμένες μορφές γλώσσας, όπως είχε απαιτηθεί στο παρελθόν.

Για παράδειγμα, το 2024 η ομάδα της Google DeepMind είχε συμμετάσχει στο ίδιο πλαίσιο, χρησιμοποιώντας τα συστήματα AlphaGeometry και AlphaProof. Παρ’ ότι είχαν αφιερωθεί 2-3 ημέρες υπολογιστικής ισχύος, τα εργαλεία αυτά χρειάζονταν πρώτα να μεταφράσουν τα προβλήματα σε τεχνική γλώσσα πριν επιχειρήσουν την επίλυση. Το αποτέλεσμα τότε ήταν ένα αργυρό μετάλλιο, με τέσσερις σωστές λύσεις και 28 βαθμούς.

Η πρόοδος μέσα σε ένα χρόνο είναι εντυπωσιακή, και δείχνει όχι μόνο την εξέλιξη των μοντέλων Gemini, αλλά και την κατεύθυνση που παίρνει η τεχνητή νοημοσύνη: προς μια πιο φυσική και άμεση κατανόηση της ανθρώπινης σκέψης.

Το Deep Think mode αποτελεί μια ενισχυμένη λειτουργία λογικής σκέψης που αξιοποιεί τεχνικές αιχμής, όπως η παράλληλη επεξεργασία. Αντί να ακολουθεί μια γραμμική πορεία σκέψης προς τη λύση ενός προβλήματος, το μοντέλο έχει την ικανότητα να εξερευνά πολλαπλές προσεγγίσεις ταυτόχρονα και να τις συνδυάζει, πριν καταλήξει στην τελική απάντηση. Αυτή η στρατηγική όχι μόνο αυξάνει τις πιθανότητες επίλυσης, αλλά παράγει και πιο δημιουργικές ή εναλλακτικές λύσεις, προσεγγίζοντας τον τρόπο σκέψης των καλύτερων ανθρώπινων μαθηματικών.

Αν και δεν έχει δοθεί ακόμα ημερομηνία κυκλοφορίας για το Deep Think, η Google ανακοίνωσε ότι μια πρώτη έκδοση του μοντέλου θα διατεθεί σύντομα σε ομάδα επιλεγμένων χρηστών, ανάμεσα στους οποίους θα περιλαμβάνονται και επαγγελματίες μαθηματικοί. Στη συνέχεια, το Deep Think αναμένεται να ενσωματωθεί στο Google AI Ultra, τη συνδρομητική υπηρεσία των 250 δολαρίων μηνιαίως, χωρίς όμως να υπάρχει σαφές χρονοδιάγραμμα για την επίσημη διάθεση.

[via]