Σύνοψη
- Η Google αντικατέστησε το μέτρημα των prompts με ένα "compute-based" μοντέλο χρέωσης πόρων, προκαλώντας διαμαρτυρίες για την ταχεία εξάντληση των ορίων.
- Ο επικεφαλής του Gemini, Josh Woodward, ανακοίνωσε "πλαφόν" στη μέγιστη κατανάλωση ενός μεμονωμένου prompt για να προστατεύσει την ποσόστωση (quota) των χρηστών.
- Τα αποτυχημένα αιτήματα πλέον δεν αφαιρούνται από τα διαθέσιμα όρια του συνδρομητή.
- Το μοντέλο Gemini 3.1 Flash-Lite προσφέρεται πλέον δωρεάν, χωρίς να καταναλώνει την ποσόστωση.
- Διπλασιάστηκαν τα όρια παραγωγής Omni βίντεο για τους χρήστες του κορυφαίου πακέτου AI Ultra.
Το πρόσφατο συνέδριο προγραμματιστών Google I/O 2026 έφερε ριζικές αλλαγές στον τρόπο με τον οποίο η εταιρεία διαχειρίζεται και κατανέμει την υπολογιστική ισχύ που παρέχει στους χρήστες της πλατφόρμας Gemini. Η μετάβαση από τον παραδοσιακό, απλό περιορισμό βάσει του αριθμού των ημερήσιων εντολών σε ένα αυστηρό, δυναμικό "compute-based" μοντέλο, δημιούργησε νέα δεδομένα για τους συνδρομητές. Ωστόσο, η εφαρμογή αυτού του νέου συστήματος ανέδειξε άμεσα κατασκευαστικές αστοχίες και ανισορροπίες, αναγκάζοντας την Google να προχωρήσει σε άμεσες διορθωτικές παρεμβάσεις.
Μέχρι πρότινος, τα όρια του Gemini ήταν γραμμικά και εύκολα προβλέψιμα: ο χρήστης είχε στη διάθεσή του έναν συγκεκριμένο αριθμό μηνυμάτων ανά ημέρα. Το νέο σύστημα, ωστόσο, εισήγαγε τον όρο "Compute Math". Πλέον, ο αλγόριθμος συνυπολογίζει τρεις κρίσιμους παράγοντες: την πολυπλοκότητα της εντολής (π.χ. δημιουργία κώδικα ή παραγωγή βίντεο έναντι ενός απλού κειμένου), τα εργαλεία που αξιοποιούνται παράλληλα (όπως το Deep Research) και το συνολικό μήκος του context window της συζήτησης. Τα νέα όρια ανανεώνονται κάθε 5 ώρες, διατηρώντας ωστόσο ένα απόλυτο εβδομαδιαίο μέγιστο όριο (weekly cap).
Αυτή η αλλαγή αρχιτεκτονικής σήμαινε πρακτικά ότι οι χρήστες έβλεπαν την "μπαταρία" της ποσόστωσης τους να αδειάζει ραγδαία και απροειδοποίητα. Χαρακτηριστικό είναι το παράδειγμα ενός συνδρομητή του Google AI Pro, ο οποίος ανέφερε ότι μία και μόνο εντολή για τη δημιουργία ενός σύνθετου avatar video εξάντλησε την πεντάωρη ποσόστωσή του μέσα σε ελάχιστα λεπτά, με το τελικό αρχείο να μην παράγεται καν. Η έλλειψη διαφάνειας ως προς το ακριβές υπολογιστικό κόστος κάθε εντολής δημιούργησε ένα περιβάλλον ανασφάλειας.
Ποιες είναι οι νέες αλλαγές στα όρια χρήσης του Google Gemini;
Η Google αναπροσάρμοσε τα νέα compute-based όρια χρήσης του Gemini 3.1 Pro, βάζοντας "πλαφόν" στη μέγιστη κατανάλωση ανά μεμονωμένο prompt. Σύμφωνα με τον επικεφαλής Josh Woodward, οι αποτυχημένες εντολές δεν αφαιρούν πλέον ποσόστωση, τα prompts στο ελαφρύτερο μοντέλο 3.1 Flash-Lite γίνονται εντελώς δωρεάν, ενώ διορθώθηκε το κρίσιμο σφάλμα εξάντλησης ορίων κατά τη δημιουργία Omni βίντεο.
Οι παρεμβάσεις αναλυτικά:
- Προστασία ανά Prompt: Κανένα μεμονωμένο, υπερβολικά περίπλοκο αίτημα (ακόμη και με ογκώδη επισυναπτόμενα αρχεία PDF) δεν μπορεί πλέον να μηδενίσει την ποσόστωση του χρήστη με μία κίνηση. Ο αλγόριθμος περιορίζει τη μέγιστη απορρόφηση πόρων ανά εκτέλεση.
- Μηδενική Χρέωση για Σφάλματα: "Αν ένα αίτημα αποτύχει, δεν χρεώνεστε. Τα λάθη του συστήματος βαρύνουν εμάς, όχι εσάς", επιβεβαίωσε ρητά ο Woodward. Η ποσόστωση (quota) καταναλώνεται αποκλειστικά σε επιτυχημένες εκτελέσεις.
- Δωρεάν το 3.1 Flash-Lite: Για καθημερινές, ελαφριές εργασίες ρουτίνας, το μοντέλο 3.1 Flash-Lite δεν προσμετράται πλέον στα όρια (quota-free). Αυτό σημαίνει ότι το AI παραμένει διαθέσιμο για βασικές ερωτήσεις ακόμα και αν τα heavy-compute όρια έχουν εξαντληθεί.
- Επίλυση του Omni Bug: Οι συνδρομητές του AI Ultra ανέφεραν ότι η παραγωγή μόλις ενός ή δύο Omni βίντεο εξαντλούσε τα όριά τους. Το σφάλμα επιλύθηκε και τα όρια παραγωγής (generations) για τους Ultra χρήστες διπλασιάστηκαν.
Η νέα δομή των συνδρομητικών πακέτων (Tiers)
Για να γίνει απόλυτα κατανοητός ο λόγος που τα compute-limits απέκτησαν τόσο κρίσιμη σημασία, πρέπει να εξετάσουμε την αρχιτεκτονική των πακέτων. Η Google ουσιαστικά καταργεί την έννοια της "απεριόριστης χρήσης" αιχμής.
- Gemini Standard: Προσφέρει παράθυρο μνήμης (context window) 32.000 tokens (περίπου 50 σελίδες κειμένου) και αυστηρούς περιορισμούς στη μεταφόρτωση (βίντεο έως 5 λεπτά).
- Google AI Plus: Παρέχει 2x όρια από το δωρεάν πακέτο και αυξάνει το context window στα 128.000 tokens.
- Google AI Pro: Διαθέτει 4x όρια. Ξεκλειδώνει το τεράστιο παράθυρο του 1 εκατομμυρίου tokens, το οποίο "χωράει" ταυτόχρονα έως και 1.500 σελίδες κειμένου ή 30.000 γραμμές κώδικα, αλλά η ανάγνωσή τους "καίει" άμεσα τη διαθέσιμη ισχύ.
- Google AI Ultra: Σχεδιασμένο για Enterprise, προσφέρει 5x όρια χρήσης σε σχέση με το Pro (και 20x στο Enterprise πλάνο των $200), με πλήρη ενσωμάτωση του Gemini 3.5 Flash για ταχύτατο testing και 20TB cloud storage.
Η επίδραση στους προγραμματιστές και το Antigravity
Η πίεση των νέων ορίων ήταν αφόρητη για τους προγραμματιστές που χρησιμοποιούν το Antigravity, την agent-first πλατφόρμα ανάπτυξης κώδικα της Google. Τα compute-based limits ανάγκασαν την εταιρεία να αυξήσει τα όρια (rate limits) κατά 3 φορές (3x) —δύο φορές μέσα στην ίδια εβδομάδα— πραγματοποιώντας και καθολικό reset στις εβδομαδιαίες ποσοστώσεις των συνδρομητών.
Ο κώδικας, από τη φύση του, απαιτεί συχνό debugging. Κάθε φορά που ένας developer έστελνε στο σύστημα ένα νέο prompt για τη διόρθωση ενός bug, το σύστημα "ξαναδιάβαζε" ολόκληρο το ιστορικό (chat history), χρεώνοντας το compute limit πολλαπλασιαστικά. Με τη ρητή δέσμευση της Google ότι οι αποτυχημένες εκτελέσεις και τα error logs του συστήματος δεν θα καταναλώνουν πολύτιμη ποσόστωση, το περιβάλλον του Antigravity καθίσταται ξανά διαχειρίσιμο.