Η OpenAI σοκάρει με το Sora 2, το νέο AI εργαλείο παραγωγής video

Η OpenAI ανακοίνωσε επίσημα το Sora 2, το πιο προηγμένο μοντέλο της για δημιουργία βίντεο και ήχου με τεχνητή νοημοσύνη, μαζί με μια ολοκαίνουργια εφαρμογή για iOS που φέρνει στους χρήστες μια ροή περιεχομένου αποκλειστικά παραγόμενου από AI. Η κίνηση αυτή έρχεται λίγους μόλις μήνες μετά την κυκλοφορία του Google Veo 3, σηματοδοτώντας την προσπάθεια της OpenAI να ανταγωνιστεί δυναμικά στον χώρο του generative video.

Το Sora 2 έρχεται μόλις δέκα μήνες μετά το αρχικό Sora, το οποίο είχε χαρακτηριστεί από την εταιρεία ως το “GPT-1 moment” για τον κόσμο του βίντεο. Αντίστοιχα, το νέο μοντέλο παρουσιάζεται ως το “GPT-3.5 moment”, μια σημαντική αναβάθμιση που αποτυπώνει το άλμα στην πολυπλοκότητα και τη ρεαλιστικότητα των δυνατοτήτων του. Σύμφωνα με την OpenAI, το Sora 2 ξεχωρίζει γιατί κατανοεί σε βάθος τη φυσική πραγματικότητα, αποφεύγοντας λάθη που χαρακτήριζαν προηγούμενες τεχνολογίες, όπως μπαλάκια του μπάσκετ που “τηλεμεταφέρονταν” μέσα στο καλάθι αντί να ακολουθούν κανονικά την τροχιά τους.

Η δεύτερη γενιά του μοντέλου μπορεί να αποδώσει κινήσεις μεγάλης ακρίβειας, όπως πολύπλοκες ασκήσεις γυμναστικής επιπέδου Ολυμπιακών Αγώνων, ανατροπές σε σανίδες θαλάσσης με σωστή προσομοίωση άντωσης και ακαμψίας, ή ακόμα και τριπλά axels από εικονικούς χαρακτήρες. Σημαντικό στοιχείο είναι ότι το Sora 2 προσομοιώνει με πειστικότητα όχι μόνο τις επιτυχίες αλλά και τις αποτυχίες, προσφέροντας πιο αληθοφανή απόδοση του κόσμου.

Μια ακόμη καινοτομία του Sora 2 είναι ο βαθμός ελέγχου που παρέχει στους δημιουργούς. Το μοντέλο μπορεί να ακολουθήσει σύνθετες οδηγίες για πολλαπλές σκηνές, διατηρώντας τη συνοχή του περιβάλλοντος και των χαρακτήρων από το ένα πλάνο στο άλλο. Παράλληλα, υποστηρίζει διαφορετικά οπτικά στυλ, από ρεαλιστικό και κινηματογραφικό μέχρι αισθητική τύπου anime, δίνοντας ευελιξία σε επαγγελματίες και ερασιτέχνες δημιουργούς.

Ιδιαίτερο ενδιαφέρον παρουσιάζει η λειτουργία των λεγόμενων “cameos”. Μέσα από αυτήν, οι χρήστες μπορούν να ενσωματώσουν ρεαλιστικές ψηφιακές αναπαραστάσεις του εαυτού τους, φίλων ή αντικειμένων, σε οποιοδήποτε περιβάλλον δημιουργεί το Sora. Αρκεί ένα σύντομο δείγμα βίντεο και ήχου για να εισαχθεί η προσωπική “υπογραφή” σε ένα τεχνητά παραγόμενο σκηνικό.

Η OpenAI συνοδεύει την κυκλοφορία του νέου μοντέλου με την παρουσίαση της εφαρμογής Sora για iOS. Μέσα από αυτήν, οι χρήστες μπορούν να δημιουργούν, να επεξεργάζονται και να μοιράζονται βίντεο, αξιοποιώντας και τη δυνατότητα των cameos. Η εφαρμογή ενσωματώνει μια ροή με βίντεο που παράγονται εξ ολοκλήρου από AI. Ωστόσο, η εταιρεία τονίζει πως δεν στοχεύει να ενθαρρύνει το παθητικό “doomscrolling” που συχνά παρατηρείται σε άλλες πλατφόρμες, αλλά να ενισχύσει τη δημιουργικότητα και τη διαδραστικότητα.

Για την ασφάλεια των χρηστών, η OpenAI έχει ανακοινώσει ότι χρησιμοποιεί αλγόριθμους προτάσεων που ελέγχονται με φυσική γλώσσα, ενώ η εφαρμογή διαθέτει εργαλεία όπως υπενθυμίσεις ευεξίας και δυνατότητα προσαρμογής της ροής. Σε εφήβους επιβάλλονται αυτόματα όρια στη χρήση, ενώ οι γονείς μπορούν να αξιοποιήσουν εργαλεία βασισμένα στο ChatGPT για να ρυθμίσουν τις παραμέτρους και να προστατεύσουν τους νεότερους χρήστες.

Η εφαρμογή είναι ήδη διαθέσιμη στο iOS για λήψη, με τη διαδικασία πρόσβασης να γίνεται μέσω πρόσκλησης. Όσοι αποκτήσουν πρόσβαση θα μπορούν να χρησιμοποιούν το Sora 2 δωρεάν σε αυτήν την πρώιμη φάση, τόσο μέσω της εφαρμογής όσο και από την ιστοσελίδα της OpenAI. Οι συνδρομητές του ChatGPT Pro θα έχουν επιπλέον πρόσβαση στο Sora 2 Pro, ένα αναβαθμισμένο μοντέλο υψηλότερης ποιότητας, καθώς και στο ήδη υπάρχον Sora 1 Turbo. Παράλληλα, η εταιρεία σχεδιάζει να διαθέσει σύντομα το Sora 2 και μέσω API, ανοίγοντας τον δρόμο για την ενσωμάτωσή του σε εφαρμογές τρίτων.

Sora 2 - [App Store Link]