Technology

Stable Video Diffusion: Το νέο AI εργαλείο για παραγωγή video από εικόνα

Η Stability AI, δημιουργός του Stable Diffusion, ανακοίνωσε επίσημα το νέο προϊόν παραγωγικής Τεχνητής Νοημοσύνης Stable Video Diffusion, το οποίο λανσάρεται σε preview έκδοση για να δώσει στους χρήστες τη δυνατότητα δημιουργίας videos μέσα από μια απλή εικόνα. «Αυτό το τελευταίας τεχνολογίας παραγωγικό AI μοντέλο για video αντιπροσωπεύει ένα σημαντικό βήμα στο ταξίδι μας προς τη δημιουργία μοντέλων για όλους και για κάθε τύπο», αναφέρει η εταιρεία.

Το νέο AI εργαλείο συνδυάζει δύο μοντέλα μετατροπής εικόνας σε video, το καθένα με τη δυνατότητα παραγωγής 14 έως 25 καρέ σε ταχύτητα από 3 έως 30fps και σε ανάλυση 1024 x 576. «Κατά τη στιγμή της κυκλοφορίας στη θεμελιώδη μορφή τους, μέσω εξωτερικής αξιολόγησης, διαπιστώσαμε ότι τα μοντέλα αυτά ξεπερνούν τα κορυφαία κλειστά μοντέλα σε μελέτες προτίμησης των χρηστών», δήλωσε η εταιρεία, συγκρίνοντας τα με τις πλατφόρμες μετατροπής κειμένου σε video των Runway και Pika Labs.

Στην παρούσα φάση, το Stable Video Diffusion είναι διαθέσιμο μόνο για ερευνητικά projects. Οι ενδιαφέρομενοι θα πρέπει να εγγραφούν στη σχετική λίστα αναμονής για να αποκτήσουν πρόσβαση στην web πλατφόρμα, αλλά μεταγενέστερα θα μπορούσε να αξιοποιηθεί για διαφημιστικούς, εκπαιδευτικούς και ψυχαγωγικούς σκοπούς.

Από τα δείγματα που βλέπουμε στο video, η ποιότητα φαίνεται αρκετά υψηλή και εφάμιλλη άλλων ανταγωνιστικών συστημάτων. Παρόλα αυτά, υπάρχουν κάποιοι περιορισμοί. Τα videos έχουν διάρκεια μικρότερη από 4 δευτερόλεπτα, δεν υπάρχει κίνηση της κάμερας, δεν υπάρχει έλεγχος στο κείμενο, ενώ η εμφάνιση του κειμένου μέσα στο video και η παραγωγή ανθρώπων και προσώπων δεν είναι και η καλύτερη.

Η Stability AI εκπαίδευσε το νέο μοντέλο της με εκατομύρια videos και στη συνέχεια βελτιστοποιήθηκε με μια μικρότερη βάση περιεχομένου. Η εταιρεία αναφέρει ότι όλα τα videos που χρησιμοποιήθηκαν για την εκπαίδευση ήταν διαθέσιμα δημοσίως για ερευνητικούς σκοπούς.