Η επεξεργασία εικόνων στο Gemini μόλις έλαβε μια σημαντική αναβάθμιση

Η Google προχωρά σε μια νέα προσέγγιση στην επεξεργασία εικόνων με το Gemini, δίνοντας στους χρήστες τη δυνατότητα να μεταμορφώνουν τις φωτογραφίες τους με τη βοήθεια της AI, διατηρώντας όμως την ταυτότητα και τα χαρακτηριστικά τους ανέπαφα. Η ιδέα είναι απλή αλλά σημαντική: μια φωτογραφία που έχει υποστεί αλλαγές και δεν μοιάζει ακριβώς με το αρχικό θέμα δημιουργεί μια αίσθηση ασυνέπειας, κάτι που οι νέες δυνατότητες του Gemini επιχειρούν να διορθώσουν.

Μέχρι τώρα, οι χρήστες μπορούσαν να τροποποιούν φωτογραφίες προσθέτοντας φόντα, αντικείμενα ή ρούχα που δημιουργούνταν από AI. Ωστόσο, οι προηγούμενες τεχνολογίες συχνά παρουσίαζαν ασυνέπειες στην εμφάνιση του κύριου θέματος. Το Gemini υπόσχεται να εξαλείψει αυτά τα προβλήματα, διασφαλίζοντας ότι το άτομο ή το κατοικίδιο στη φωτογραφία παραμένει αναγνωρίσιμο και συνεπές σε κάθε αλλαγή ή σενάριο.

Η Google περιγράφει τη διαδικασία ως εξής: ο χρήστης δίνει στο Gemini μια φωτογραφία και καθορίζει τι θέλει να αλλάξει σε αυτή. Οι επιλογές περιλαμβάνουν την αλλαγή τοποθεσίας, την τοποθέτηση του θέματος σε διαφορετική δεκαετία ή ακόμη και τη συνένωση δύο φωτογραφιών για να δημιουργηθεί μια ενιαία, συνεκτική εικόνα.

Μία από τις βασικές δυνατότητες του Gemini αφορά την αλλαγή κοστουμιού ή τοποθεσίας για ένα άτομο ή ένα κατοικίδιο. Ανεβάζοντας τη φωτογραφία και δίνοντας τις κατάλληλες εντολές, το Gemini διατηρεί την εμφάνιση του θέματος αμετάβλητη, ακόμα και όταν το τοποθετεί σε νέα περιβάλλοντα. Η Google τονίζει ότι η συνέπεια της εμφάνισης είναι κεντρικός άξονας της τεχνολογίας, ώστε οι χρήστες να μην χάνουν την αίσθηση της ταυτότητας στις εικόνες τους.

Μια ακόμη καινοτομία είναι η δυνατότητα συνένωσης φωτογραφιών. Για παράδειγμα, αν κάποιος θέλει να προσθέσει τον εαυτό του σε μια φωτογραφία του αγαπημένου του κατοικίδιου, μπορεί να ανεβάσει τις δύο εικόνες και να ζητήσει από το Gemini να τις συνδυάσει σε ένα ολοκληρωμένο πορτρέτο. Οι χρήστες μπορούν να ορίζουν λεπτομέρειες, όπως η διατήρηση του αρχικού φόντου ή η τοποθέτηση του θέματος σε συγκεκριμένη σκηνή, όπως ένα γήπεδο μπάσκετ.

Η δυνατότητα πολυ-βηματικής επεξεργασίας είναι επίσης σημαντική. Οι χρήστες μπορούν να ξεκινούν από μια βασική εικόνα, όπως ένα κενό δωμάτιο, και να ζητούν από το Gemini να βάψει τους τοίχους, να αλλάξει χρώματα ή να προσθέσει έπιπλα μέχρι να φτάσουν στο επιθυμητό αποτέλεσμα. Αυτή η λειτουργία καθιστά το Gemini εργαλείο όχι μόνο για δημιουργική έκφραση, αλλά και για σχεδιασμό και πειραματισμό σε πραγματικά πρότζεκτ, όπως η διακόσμηση του σπιτιού.

Μια ακόμη δυνατότητα που ξεχωρίζει είναι το design mixing. Η λειτουργία αυτή επιτρέπει στον χρήστη να εφαρμόσει το στυλ μιας εικόνας σε αντικείμενα άλλης εικόνας, δημιουργώντας πρωτότυπους συνδυασμούς. Για παράδειγμα, τα χρώματα και η υφή ενός λουλουδιού μπορούν να μεταφερθούν σε ένα ζευγάρι γαλότσες ή το μοτίβο από ένα αγαπημένο wallpaper να εμφανιστεί σε ένα T-shirt. Αυτή η ευελιξία ανοίγει νέες δυνατότητες για πειραματισμό με στυλ και αισθητική, τόσο σε προσωπικό όσο και σε επαγγελματικό επίπεδο.

Η Google αναφέρει ότι το αναβαθμισμένο μοντέλο επεξεργασίας εικόνων του Gemini είναι ήδη διαθέσιμο και θα γίνει ευρέως ορατό στους χρήστες μέσα στην εβδομάδα.

[via]