Το Gemini μετατρέπει πλέον και τις φωτογραφίες σε videos μέσω του Veo 3

Η Google συνεχίζει να επεκτείνει τις δυνατότητες της πλατφόρμας Gemini, λανσάροντας επίσημα τη λειτουργία μετατροπής φωτογραφιών σε βίντεο με χρήση του μοντέλου τεχνητής νοημοσύνης Veo 3. Η νέα δυνατότητα επιτρέπει στους χρήστες να δημιουργούν σύντομα βίντεο διάρκειας έως οκτώ δευτερολέπτων με ήχο, ξεκινώντας από μια απλή στατική εικόνα.

Μετά την ευρεία διάθεση του Veo 3 σε συνδρομητές την προηγούμενη εβδομάδα, η νέα λειτουργία ενσωματώνεται πλέον σταδιακά στην εφαρμογή Gemini, ξεκινώντας από την έκδοση που είναι διαθέσιμη μέσω του gemini.google.com. Η υποστήριξη για τις αντίστοιχες εφαρμογές σε κινητές συσκευές αναμένεται να ακολουθήσει σύντομα.

Η διαδικασία είναι απλή και προσβάσιμη από το περιβάλλον της εφαρμογής. Ο χρήστης μπορεί να επιλέξει το νέο πεδίο “Videos” στο πεδίο εισαγωγής της Gemini και να ανεβάσει μια φωτογραφία. Αμέσως μετά, καλείται να περιγράψει τη σκηνή και τον ήχο που θα συνοδεύει το τελικό βίντεο — από διαλόγους και ηχητικά εφέ μέχρι φυσικούς ήχους περιβάλλοντος. Σύμφωνα με την Google, η χρήση της λειτουργίας μπορεί να δώσει ζωή σε καθημερινά αντικείμενα, σχέδια και πίνακες ή να προσδώσει κίνηση σε στατικά τοπία της φύσης.

Τα τελικά αρχεία εξάγονται σε μορφή MP4, με ανάλυση 720p και αναλογία 16:9 (οριζόντιο κάδρο), και μπορούν να αποθηκευτούν ή να κοινοποιηθούν. Η λειτουργία είναι διαθέσιμη αποκλειστικά στους συνδρομητές των πακέτων Google AI Pro, με μηνιαίο κόστος 19,99 δολάρια, και AI Ultra, που κοστίζει 249,99 δολάρια το μήνα.

Όσον αφορά στην ασφάλεια και την αξιοπιστία του περιεχομένου, η Google έχει ενσωματώσει δύο επίπεδα σήμανσης για την προέλευση των βίντεο. Κάθε παραγόμενο από το Veo βίντεο περιλαμβάνει εμφανές υδατογράφημα με την ένδειξη “Veo” στην κάτω δεξιά γωνία, ενώ υπάρχει και ένα ψηφιακό υδατογράφημα μέσω της τεχνολογίας SynthID, το οποίο είναι αόρατο στον τελικό χρήστη αλλά αναγνωρίσιμο από συστήματα ελέγχου.

Η εταιρεία αναφέρει ότι έχει επενδύσει σημαντικά σε διαδικασίες ελέγχου, περιλαμβάνοντας δοκιμές “red teaming”, μια τακτική κατά την οποία προσομοιώνονται σενάρια κατάχρησης ώστε να εντοπιστούν αδυναμίες πριν αυτές αξιοποιηθούν. Παράλληλα, η Google πραγματοποιεί αναλυτικές αξιολογήσεις σχετικά με τις πιθανές χρήσεις των εργαλείων της και εφαρμόζει αυστηρές πολιτικές για την αποτροπή ακατάλληλου ή επικίνδυνου περιεχομένου.

Η Google γνωστοποίησε επίσης ότι σε μόλις επτά εβδομάδες από την κυκλοφορία του Veo 3, έχουν δημιουργηθεί πάνω από 40 εκατομμύρια βίντεο μέσω της εφαρμογής Gemini και της πλατφόρμας Flow, που ήδη υποστήριζε τη μετατροπή φωτογραφιών σε βίντεο. Οι αριθμοί αυτοί καταδεικνύουν τη δυναμική αποδοχή της λειτουργίας από το κοινό, αλλά και τη συνεχώς αυξανόμενη τάση για δημιουργία οπτικού περιεχομένου μέσω τεχνητής νοημοσύνης.

[via]

Loading