Η Midjourney, μια από τις πιο γνωστές startup στον χώρο της δημιουργίας εικόνας μέσω τεχνητής νοημοσύνης, ανακοίνωσε την επίσημη κυκλοφορία του πρώτου της μοντέλου παραγωγής βίντεο, με την ονομασία V1. Πρόκειται για μια πολυαναμενόμενη εξέλιξη από μια εταιρεία που έχει διακριθεί για την εικαστική ποιότητα των οπτικών έργων που δημιουργούν τα μοντέλα της.
Το νέο μοντέλο V1 λειτουργεί με βάση την τεχνική image-to-video. Οι χρήστες μπορούν να ανεβάσουν μια εικόνα – είτε πρόκειται για δική τους είτε για εικόνα που έχει ήδη δημιουργηθεί μέσω κάποιου άλλου μοντέλου της Midjourney – και το V1 θα παραγάγει τέσσερα σύντομα βίντεο διάρκειας πέντε δευτερολέπτων το καθένα, βασισμένα στο συγκεκριμένο οπτικό υλικό. Όπως συμβαίνει και με τις προηγούμενες υπηρεσίες της εταιρείας, η χρήση του V1 περιορίζεται στη πλατφόρμα Discord και, τουλάχιστον αρχικά, είναι διαθέσιμο μόνο μέσω browser.
Με την είσοδό της στον χώρο του AI video, η Midjourney έρχεται αντιμέτωπη με άλλες σημαντικές εταιρείες τεχνολογίας όπως η OpenAI με το Sora, η Runway με το Gen 4, η Adobe με το Firefly και η Google με το Veo 3. Παρόλο που η πλειονότητα των εταιρειών αυτών εστιάζει στην εμπορική χρήση και στον έλεγχο της παραγόμενης εικόνας – όπως για παραγωγές διαφημίσεων ή κινηματογραφικών έργων – η Midjourney διατηρεί τον ξεχωριστό της χαρακτήρα. Η εστίασή της παραμένει στη δημιουργικότητα, προσφέροντας εργαλεία με έντονη καλλιτεχνική ταυτότητα.
Σύμφωνα με ανάρτηση του CEO της εταιρείας, David Holz, η ανάπτυξη του V1 αποτελεί απλώς το πρώτο βήμα προς έναν πιο φιλόδοξο στόχο: τη δημιουργία μοντέλων τεχνητής νοημοσύνης που θα μπορούν να προσομοιώνουν, σε πραγματικό χρόνο, ανοικτού τύπου κόσμους. Το μεσοπρόθεσμο πλάνο της Midjourney περιλαμβάνει, εκτός από τα μοντέλα βίντεο, και την ανάπτυξη εργαλείων για 3D απεικονίσεις καθώς και μοντέλα πραγματικού χρόνου, τα οποία θα διευρύνουν σημαντικά τις δημιουργικές δυνατότητες των χρηστών.
Μόλις μία εβδομάδα πριν, η εταιρεία βρέθηκε στο επίκεντρο νομικής διαμάχης, καθώς οι κινηματογραφικοί κολοσσοί Disney και Universal την κατηγόρησαν ότι τα μοντέλα της παρήγαγαν εικόνες που παραπέμπουν σε χαρακτήρες τους, όπως ο Homer Simpson και ο Darth Vader, που προστατεύονται από πνευματικά δικαιώματα. Η υπόθεση έρχεται να προστεθεί σε μια σειρά ανησυχιών από τη βιομηχανία του θεάματος, η οποία αντιμετωπίζει με σκεπτικισμό την αυξανόμενη δημοτικότητα των AI εργαλείων δημιουργίας οπτικού περιεχομένου. Ο φόβος ότι τέτοιες τεχνολογίες μπορεί να αντικαταστήσουν ανθρώπινη δημιουργικότητα ή να βασίζονται σε υλικό που προστατεύεται από πνευματικά δικαιώματα είναι διάχυτος.
Παρά τις προσπάθειες της Midjourney να διαφοροποιηθεί από άλλες εταιρείες του χώρου, προβάλλοντας έναν πιο «καλλιτεχνικό» χαρακτήρα, οι αντιδράσεις από τη βιομηχανία δείχνουν ότι δεν είναι εύκολο να αποφύγει τη συζήτηση γύρω από τα ηθικά και νομικά όρια της τεχνητής νοημοσύνης.
Από πλευράς κόστους, η παραγωγή βίντεο μέσω του Midjourney V1 θα απαιτεί σημαντικά περισσότερους πόρους σε σχέση με την παραγωγή εικόνας. Συγκεκριμένα, κάθε δημιουργία βίντεο θα κοστίζει περίπου οκταπλάσια από μια εικόνα, κάτι που σημαίνει ότι οι χρήστες θα εξαντλούν πιο γρήγορα τις διαθέσιμες μονάδες του μηνιαίου τους πακέτου. Η πιο προσιτή συνδρομή για τη χρήση του V1 είναι το πακέτο των 10 δολαρίων τον μήνα, ενώ όσοι επιλέξουν τα πιο ακριβά προγράμματα των 60 ή 120 δολαρίων θα έχουν πρόσβαση σε απεριόριστη δημιουργία βίντεο, υπό τον περιορισμό της αργής λειτουργίας Relax. Η Midjourney έχει δηλώσει ότι μέσα στον επόμενο μήνα θα επανεξετάσει την τιμολογιακή της πολιτική για το νέο μοντέλο.
Το V1 συνοδεύεται από επιλογές προσαρμογής για τον έλεγχο της κίνησης στο παραγόμενο βίντεο. Οι χρήστες μπορούν να επιλέξουν αυτόματο animation με τυχαία κίνηση ή να εισάγουν κείμενο που περιγράφει συγκεκριμένη δράση. Επιπλέον, υπάρχουν επιλογές για ρύθμιση της έντασης της κίνησης της κάμερας και του θέματος, με δυνατότητα επιλογής μεταξύ "low motion" και "high motion".
Αν και τα βίντεο του V1 είναι περιορισμένα σε διάρκεια, μόνο πέντε δευτερόλεπτα αρχικά, προσφέρεται η δυνατότητα παράτασης κατά τέσσερα δευτερόλεπτα, μέχρι και τέσσερις φορές. Έτσι, ένα τελικό βίντεο μπορεί να φτάσει έως και τα 21 δευτερόλεπτα.
Τα πρώτα δείγματα από τη λειτουργία του V1 έχουν αφήσει θετικές εντυπώσεις, με την αισθητική τους να χαρακτηρίζεται περισσότερο ονειρική και αφηρημένη, παρά απόλυτα ρεαλιστική. Παρά το εντυπωσιακό ντεμπούτο, μένει να φανεί πώς θα σταθεί απέναντι σε ανταγωνιστικά εργαλεία που κυκλοφορούν ήδη στην αγορά για μεγάλο χρονικό διάστημα.
[via]