OpenAI: Απίστευτες δημιουργίες video από το νέο AI εργαλείο, το Sora!

Ο OpenAI άλλαξε τον κόσμο πέρυσι με το λανσάρισμα του ChatGPT και φιλοδοξεί να κάνει το ίδιο φέτος σε έναν άλλο τομέα: στη δημιουργία video από γραπτές περιγραφές. Το νέο μοντέλο από τους δημιουργούς των ChatGPT και DALL-E ονομάζεται Sora και είναι ήδη διαθέσιμο στους red teamers, δηλαδή στους ειδικούς που δοκιμάζουν αντιπαραθετικά το μοντέλο για βλάβες και κινδύνους. Σύμφωνα με την ανακοίνωση, είναι επίσης διαθέσιμο σε μια επιλεγμένη ομάδα εικαστικών καλλιτεχνών, σχεδιαστών και κινηματογραφιστών "για να λάβουν feedback σχετικά με το πώς να προωθήσουν το μοντέλο ώστε να είναι πιο χρήσιμο για τους δημιουργικούς επαγγελματίες".

Ο OpenAI αναπτύσσει εργαλεία παραγωγικής Τεχνητής Νοημοσύνης (AI) με ιλιγγιώδεις ρυθμούς από τότε που ξεκίνησε το ChatGPT τον Νοέμβριο του 2022. Από τότε, είδαμε την έκδοση GPT-4, φωνητικές και απεικονιστικές προτροπές, το νέο μοντέλο εικόνας DALL-E 3, όλα διαθέσιμα μέσω του ChatGPT. Το API του OpenAI είχε επίσης εκθετική επίδραση στον κλάδο της Τεχνητής Νοημοσύνης, δίνοντας τη δυνατότητα σε εταιρείες και προγραμματιστές να δημιουργήσουν τα δικά τους εργαλεία παραγωγικής Τεχνητής Νοημοσύνης. Τώρα, ο OpenAI κάνει ένα σημαντικό επόμενο βήμα προς την προώθηση των δυνατοτήτων AI με τη δημιουργία βίντεο.

Υπάρχουν και άλλα μοντέλα παραγωγής βίντεο, αλλά κανένα δεν είναι σε θέση να παράγει ρεαλιστικά, σύνθετα βίντεο όπως αυτά που φέρεται να δημιουργεί το Sora. Η Meta διαθέτει ένα εργαλείο για τη δημιουργία σύντομων βίντεο κλιπ και η Google εργάζεται πάνω στο δικό της μοντέλο μετατροπής κειμένου σε βίντεο, αλλά βρίσκεται ακόμη σε ερευνητικό στάδιο.

Με το Sora, οι χρήστες μπορούν να δημιουργήσουν βίντεο διάρκειας έως και ενός λεπτού, ενσωματώνοντας λεπτομερείς σκηνές και πολλούς χαρακτήρες. Η ανακοίνωση περιλαμβάνει αποσπάσματα από ένα βίντεο που ακολουθεί ένα SUV κατά μήκος ενός δαιδαλώδους ορεινού δρόμου και "ιστορικά" πλάνα από την Καλιφόρνια κατά την εποχή του «πυρετού του χρύσου».

Τώρα για τα ψιλά γράμματα της ασφάλειας. Εκτός από το red-teaming του μοντέλου, ο OpenAI ισχυρίζεται ότι κατασκευάζει εργαλεία για την επισήμανση των βίντεο που δημιουργούνται από το Sora ως τέτοια, με τις οδηγίες της C2PA. Χρησιμοποιεί επίσης τις υπάρχουσες μεθόδους ασφαλείας που εφαρμόζονται στο DALL-E, οι οποίες απορρίπτουν ακατάλληλες ή επιβλαβείς γραπτές προτροπές.

Τέλος, ο OpenAI λέει ότι θα "συνεργαστεί με τους υπεύθυνους χάραξης πολιτικής, τους εκπαιδευτικούς και τους καλλιτέχνες σε όλο τον κόσμο για να κατανοήσει τις ανησυχίες τους και να εντοπίσει θετικές περιπτώσεις χρήσης αυτής της νέας τεχνολογίας". Ο οργανισμός πιστεύει ότι ο καλύτερος τρόπος για να μάθει όλους τους ωφέλιμους και επιβλαβείς τρόπους με τους οποίους οι άνθρωποι θα χρησιμοποιήσουν το Sora είναι "η μάθηση από την πραγματική χρήση είναι ένα κρίσιμο στοιχείο για τη δημιουργία και την κυκλοφορία όλο και πιο ασφαλών συστημάτων Τεχνητής Νοημοσύνης με την πάροδο του χρόνου".

[OpenAI]

Loading