Πλέον μπορείς να δημιουργείς AI videos μέσα στο Gemini

Η Google ανακοίνωσε τη διάθεση μιας νέας καινοτόμου δυνατότητας που επιτρέπει τη δημιουργία σύντομων βίντεο με τη βοήθεια τεχνητής νοημοσύνης, μέσω του chatbot Gemini και του πειραματικού εργαλείου Whisk. Η νέα αυτή λειτουργία βασίζεται στο προηγμένο μοντέλο βίντεο Veo 2, το οποίο ανέπτυξε η Google DeepMind και παρουσιάστηκε για πρώτη φορά το περασμένο έτος.

Το Veo 2 χρησιμοποιείται ήδη σε λειτουργίες όπως το Dream Screen για τα YouTube Shorts, όπου δίνει στους χρήστες τη δυνατότητα να δημιουργούν AI βίντεο για φόντο στις σύντομες αναρτήσεις τους. Τώρα, με την τελευταία ενημέρωση του Gemini, οι χρήστες μπορούν να μετατρέπουν απλές περιγραφές κειμένου σε δυναμικά βίντεο διάρκειας οκτώ δευτερολέπτων, ανάλυσης 720p (16:9), σε μορφή αρχείου MP4.

Για την αποφυγή υπερφόρτωσης των συστημάτων της, η Google θέτει περιορισμούς στον αριθμό των βίντεο που μπορεί να δημιουργήσει κάθε χρήστης μηνιαίως. Η λειτουργία είναι διαθέσιμη σε όλους τους συνδρομητές του Gemini Advanced παγκοσμίως, τόσο στην έκδοση web όσο και σε κινητές συσκευές, σε όλες τις υποστηριζόμενες γλώσσες.

Οι χρήστες μπορούν να επιλέξουν το μοντέλο Veo 2 από το μενού των μοντέλων του Gemini και να εισαγάγουν ένα κείμενο-εντολή (prompt) για τη σκηνή που θέλουν να δημιουργήσουν. Όσο πιο περιγραφικό είναι το κείμενο, τόσο περισσότερη λεπτομέρεια μπορεί να προσδώσει η τεχνητή νοημοσύνη στο τελικό αποτέλεσμα. Επιπλέον, η Google διευκολύνει την άμεση κοινοποίηση των βίντεο σε δημοφιλείς πλατφόρμες όπως τα YouTube Shorts και το TikTok.

Παράλληλα, η Google παρουσιάζει τη νέα δυνατότητα "Whisk Animate", μια επέκταση του πειραματικού εργαλείου Labs, το οποίο επιτρέπει τη μετατροπή εικόνων σε κινούμενα βίντεο μέσω του Veo 2. Αυτή η λειτουργία είναι διαθέσιμη αποκλειστικά για τους συνδρομητές του Google One AI Premium και δημιουργεί βίντεο διάρκειας επίσης οκτώ δευτερολέπτων.

Όλα τα βίντεο που δημιουργούνται μέσω του Veo 2 φέρουν το SynthID, ένα αόρατο ψηφιακό υδατογράφημα που είναι ενσωματωμένο σε κάθε καρέ, διασφαλίζοντας τη διάκριση του περιεχομένου ως AI-παραγόμενο.

Η στρατηγική της Google εντάσσεται σε μια ευρύτερη τάση της τεχνητής νοημοσύνης που πλέον μετατοπίζεται από τα παραδοσιακά chatbot προς τη δημιουργία περιεχομένου πολυμέσων. Χαρακτηριστικό παράδειγμα αποτελεί η πρόσφατη συνεργασία της εταιρείας σε ένα εντυπωσιακό project, όπου χρησιμοποιήθηκαν AI εργαλεία της για την αναδημιουργία μιας κλασικής ταινίας του 1939, προβληθείσα στη γιγαντιαία οθόνη 160.000 τετραγωνικών ποδιών της Las Vegas Sphere.

[via]