Η τεχνητή νοημοσύνη δεν σταματά να εκπλήσσει και το τελευταίο παράδειγμα έρχεται από την Google, η οποία παρουσίασε επίσημα το Imagen 4 – το πιο πρόσφατο και προηγμένο μοντέλο της για δημιουργία εικόνων από κείμενο. Η αποκάλυψη έγινε στο φετινό Google I/O 2025 και συνοδεύτηκε από εντυπωσιακά δείγματα που επιβεβαιώνουν τη δύναμη της νέας τεχνολογίας.
Τα συστήματα παραγωγικής τεχνητής νοημοσύνης όπως τα ChatGPT και Gemini έχουν ήδη αποδείξει ότι μπορούν να παράγουν εικόνες υψηλής ποιότητας, βασισμένες σε απλές περιγραφές κειμένου. Παράλληλα, είναι σε θέση να επεξεργάζονται υπαρκτές φωτογραφίες, προσθέτοντας ή αφαιρώντας στοιχεία με απλές εντολές. Όμως, με τις δυνατότητες αυτές έρχονται και προκλήσεις: η κατάχρηση αυτών των εργαλείων για τη δημιουργία παραπλανητικών εικόνων είναι μια ανησυχία που παραμένει επίκαιρη.

Η Google, ωστόσο, συνεχίζει να επενδύει στην εξέλιξη αυτών των τεχνολογιών, προσφέροντας συνεχώς νέες εκδοχές των μοντέλων της. Το Imagen 4 έρχεται να αντικαταστήσει το ήδη επιτυχημένο Imagen 3, ανεβάζοντας τον πήχη ακόμα ψηλότερα, τόσο στην ταχύτητα όσο και στην ποιότητα των παραγόμενων εικόνων.
Σύμφωνα με την επίσημη ανακοίνωση, το Imagen 4 ξεχωρίζει για τη σαφήνεια και την ακρίβεια στην απόδοση λεπτομερειών, όπως τα υφάσματα με περίτεχνα μοτίβα, οι σταγόνες νερού και το τρίχωμα ζώων. Το νέο μοντέλο αποδίδει εξίσου καλά τόσο σε φωτορεαλιστικές εικόνες όσο και σε πιο αφηρημένα στυλ. Επιπλέον, υποστηρίζει ανάλυση 2K και εμφανίζει βελτιωμένη απόδοση στην απεικόνιση κειμένου και τυπογραφικών στοιχείων.

Μια ακόμα σημαντική προσθήκη είναι η γρηγορότερη παραλλαγή του Imagen 4, την οποία η Google έχει προαναγγείλει, με ταχύτητα παραγωγής έως και δέκα φορές μεγαλύτερη από αυτή του προκατόχου του.
Από την Τρίτη, η Google ανακοίνωσε ότι το Imagen 4 – καθώς και η ενισχυμένη εκδοχή του, Imagen 4 Ultra – είναι διαθέσιμα για χρήση μέσω του Gemini API, σε χρήστες που συμμετέχουν στο πρόγραμμα πληρωμένης προεπισκόπησης. Παράλληλα, το Google AI Studio θα προσφέρει για περιορισμένο χρονικό διάστημα δυνατότητα δοκιμής του Imagen 4.

Η τιμολόγηση είναι διαμορφωμένη ως εξής: κάθε παραγόμενη εικόνα με το Imagen 4 κοστίζει 0,04 δολάρια, ενώ η Ultra εκδοχή φτάνει τα 0,06 δολάρια ανά εικόνα. Αναμένεται η ανακοίνωση επιπλέον επιπέδων τιμολόγησης. Όλες οι εικόνες φέρουν ένα μη ορατό υδατογράφημα με την τεχνολογία SynthID, ενώ δεν προστίθεται κάποιο εμφανές σήμα στη φωτογραφία.
Η έκδοση Imagen 4 Ultra, σύμφωνα με την Google, αποτελεί το κορυφαίο μοντέλο της μέχρι σήμερα για δημιουργία εικόνας από κείμενο. Έχει σχεδιαστεί ώστε να αποδίδει με μεγαλύτερη ακρίβεια τα στοιχεία της περιγραφής που του δίνεται, ξεπερνώντας τα μέχρι τώρα όρια στην κατανόηση και απόδοση σύνθετων εντολών. Αυτό το χαρακτηριστικό καθιστά το Ultra ιδανικό για εφαρμογές όπου απαιτείται απόλυτη πιστότητα μεταξύ κειμένου και παραγόμενης εικόνας, όπως στον σχεδιασμό προϊόντων, στη διαφήμιση ή στη δημιουργία ψηφιακού περιεχομένου υψηλής ακρίβειας.

Η Google παρουσίασε και ορισμένα παραδείγματα εικόνων που δημιουργήθηκαν με τη βοήθεια του Imagen 4 Ultra, τα οποία πραγματικά εντυπωσιάζουν. Οι εικόνες δείχνουν πόσο μακριά έχει φτάσει η τεχνητή νοημοσύνη στη δυνατότητα καλλιτεχνικής δημιουργίας, επιτυγχάνοντας όχι μόνο τεχνική αρτιότητα αλλά και αισθητική λεπτότητα.
[via]