Σύνοψη

Η OpenAI ενσωματώνει το μοντέλο παραγωγής βίντεο Sora απευθείας στο κεντρικό περιβάλλον του ChatGPT.

Η διαδικασία παραγωγής βίντεο μετατρέπεται σε συνομιλιακή, με τον χρήστη να δίνει την εντολή (prompt), να βλέπει προεπισκόπηση και να κατεβάζει το αρχείο χωρίς να αλλάζει πλατφόρμα.

Υποστηρίζεται παραγωγή βίντεο έως 30 δευτερολέπτων, με αυτόματη προσθήκη μουσικής επένδυσης (background music) και φωνητικής αφήγησης (voice-over).

Η λειτουργία αναμένεται να διατεθεί ως premium χαρακτηριστικό στους συνδρομητές του ChatGPT Plus, λόγω του εξαιρετικά υψηλού κόστους επεξεργαστικής ισχύος.

Η κυκλοφορία στην Ευρώπη ενδέχεται να υπακούει σε αυστηρότερους κανόνες (watermarking) λόγω του ευρωπαϊκού AI Act και των ανησυχιών γύρω από τα deepfakes.

Η OpenAI προχωρά στον πλήρη ανασχεδιασμό της στρατηγικής της γύρω από τη δημιουργία πολυμεσικού περιεχομένου (generative AI), φέρνοντας το πολυαναμενόμενο μοντέλο παραγωγής βίντεο, Sora, στο εσωτερικό του ChatGPT.

Σύμφωνα με πηγές του The Information, η εταιρεία εγκαταλείπει την προσέγγιση της απομονωμένης πλατφόρμας, συγκεντρώνοντας κείμενο, εικόνα και βίντεο κάτω από ένα ενιαίο, συνομιλιακό περιβάλλον.

Τι αλλάζει στη λειτουργία του ChatGPT με το Sora

Η ενσωμάτωση του μοντέλου Sora στο ChatGPT επιτρέπει τη δημιουργία, επεξεργασία και λήψη AI βίντεο απευθείας μέσα από το γνώριμο περιβάλλον συνομιλίας. Η OpenAI καταργεί την ανάγκη για εξωτερικές εφαρμογές, προσφέροντας παραγωγή κλιπ (έως 30 δευτερόλεπτα) με αυτόματη προσθήκη ήχου, στοχεύοντας αρχικά στους premium συνδρομητές λόγω των υψηλών απαιτήσεων σε υπολογιστική ισχύ.

Τεχνικά χαρακτηριστικά και δυνατότητες εξόδου

Η μετάβαση του Sora από ένα πειραματικό εργαλείο επιλεγμένων δημιουργών σε ένα εμπορικό προϊόν ευρείας χρήσης συνοδεύεται από συγκεκριμένες τεχνικές προδιαγραφές:

Διάρκεια και Ανάλυση: Υποστήριξη για παραγωγή βίντεο από 5 έως 30 δευτερόλεπτα, με δυνατότητα επιλογής aspect ratio (π.χ., 16:9 για desktop, 9:16 για mobile/social).

Υποστήριξη για παραγωγή βίντεο από 5 έως 30 δευτερόλεπτα, με δυνατότητα επιλογής aspect ratio (π.χ., 16:9 για desktop, 9:16 για mobile/social). Πολυμεσική Σύνθεση: Ενσωματωμένη ικανότητα παραγωγής native ήχου. Το μοντέλο αναλύει το prompt και δημιουργεί συγχρονισμένη μουσική υπόκρουση και ηχητικά εφέ (foley) που ταιριάζουν με την οπτική δράση.

Ενσωματωμένη ικανότητα παραγωγής native ήχου. Το μοντέλο αναλύει το prompt και δημιουργεί συγχρονισμένη μουσική υπόκρουση και ηχητικά εφέ (foley) που ταιριάζουν με την οπτική δράση. Συνομιλιακή Επεξεργασία (Iterative Editing): Ο χρήστης μπορεί να ζητήσει διορθώσεις στο παραγόμενο αποτέλεσμα μέσω φυσικής γλώσσας (π.χ., "άλλαξε τον φωτισμό σε κινηματογραφικό βραδινό" ή "κάνε την κίνηση της κάμερας πιο αργή"), χωρίς να χρειάζεται να γράψει το prompt από την αρχή.

Ο χρήστης μπορεί να ζητήσει διορθώσεις στο παραγόμενο αποτέλεσμα μέσω φυσικής γλώσσας (π.χ., "άλλαξε τον φωτισμό σε κινηματογραφικό βραδινό" ή "κάνε την κίνηση της κάμερας πιο αργή"), χωρίς να χρειάζεται να γράψει το prompt από την αρχή. Ασφάλεια και ιχνηλασιμότητα: Όλα τα βίντεο φέρουν κρυπτογραφικό υδατογράφημα (watermark) στα μεταδεδομένα (metadata) C2PA, υποδεικνύοντας σαφώς ότι το περιεχόμενο είναι προϊόν τεχνητής νοημοσύνης.

Η στρατηγική της OpenAI και το κόστος υποδομών

Η απόφαση της OpenAI να ενσωματώσει το Sora στο ChatGPT δεν είναι απλώς μια σχεδιαστική επιλογή (UI/UX), αλλά μια επιθετική απάντηση στον αυξανόμενο ανταγωνισμό. Με την Google να ενσωματώνει το Veo και την Anthropic να βελτιώνει διαρκώς το Claude, η OpenAI θέλει να καταστήσει το ChatGPT το απόλυτο, κεντρικό "λειτουργικό σύστημα" της τεχνητής νοημοσύνης για τον τελικό χρήστη.

Η διαδικασία παραγωγής βίντεο μέσω generative μοντέλων όπως το Sora (το οποίο βασίζεται σε αρχιτεκτονική diffusion transformers) απαιτεί τεράστιους πόρους από τις μονάδες επεξεργασίας γραφικών (GPUs). Η λειτουργία αυτή αυξάνει εκθετικά το λειτουργικό κόστος της εταιρείας ανά ερώτημα χρήστη (inference cost).

Αυτός είναι ο κύριος λόγος για τον οποίο η πρόσβαση θα περιοριστεί. Η OpenAI προσανατολίζεται στο να καταστήσει την παραγωγή βίντεο ένα αποκλειστικό προνόμιο των συνδρομητών του ChatGPT Plus (ή υψηλότερων tiers όπως το Team και το Enterprise), πιθανότατα με αυστηρά όρια χρήσης ανά ώρα ή ανά ημέρα. Δεν αποκλείεται η εισαγωγή ενός συστήματος credits για εκτεταμένη χρήση.

Διαθεσιμότητα και προεκτάσεις για την Ελλάδα

Για τον Έλληνα χρήστη και επαγγελματία, η ενσωμάτωση αυτή φέρνει νέα δεδομένα αλλά και συγκεκριμένους περιορισμούς.

Το κόστος της συνδρομής ChatGPT Plus στην Ελλάδα ανέρχεται στα 23 ευρώ τον μήνα (συμπεριλαμβανομένου του ΦΠΑ 24%). Εφόσον η λειτουργία ενσωματωθεί χωρίς επιπλέον κρυφά κόστη, η αναλογία τιμής-απόδοσης για τοπικούς δημιουργούς περιεχομένου, διαφημιστικές εταιρείες και δημοσιογράφους βελτιώνεται κατακόρυφα, καθώς καταργείται η ανάγκη συνδρομής σε πολλαπλά εξειδικευμένα εργαλεία (όπως Midjourney για εικόνες και Runway για βίντεο).

Ωστόσο, η διαθεσιμότητα στην ευρωπαϊκή αγορά ενδέχεται να είναι σταδιακή. Η αυστηρή εφαρμογή της Πράξης για την Τεχνητή Νοημοσύνη (AI Act) της Ευρωπαϊκής Ένωσης απαιτεί από την OpenAI να αποδείξει την ανθεκτικότητα των φίλτρων ασφαλείας του Sora απέναντι στη δημιουργία deepfakes, ρητορικής μίσους, παραπληροφόρησης και παραβίασης πνευματικών δικαιωμάτων. Οι ευρωπαϊκές ρυθμιστικές αρχές παρακολουθούν στενά την ενσωμάτωση εργαλείων τέτοιας κλίμακας, γεγονός που μπορεί να επιβάλει γεωγραφικούς περιορισμούς κατά τους πρώτους μήνες κυκλοφορίας.

Με τη ματιά του Techgear

Η κίνηση της OpenAI να φέρει το Sora μέσα στο ChatGPT επιβεβαιώνει αυτό που παρατηρούμε στην αγορά τους τελευταίους μήνες: η αξία δεν βρίσκεται πλέον στο να αναπτύσσεις το καλύτερο μεμονωμένο μοντέλο, αλλά στο να προσφέρεις ένα ενοποιημένο, προσβάσιμο οικοσύστημα.

Για την ελληνική αγορά, αυτό σημαίνει δραστική μείωση του χρόνου παραγωγής για μικρομεσαίες επιχειρήσεις και digital agencies. Εντούτοις, το βάρος πλέον πέφτει στην κατανόηση της τεχνολογίας: το να φτιάξεις ένα AI βίντεο είναι εύκολο, το να φτιάξεις ένα βίντεο που εξυπηρετεί έναν συγκεκριμένο, ουσιαστικό σκοπό χωρίς να φαίνεται "ρομποτικό" ή γενικόλογο, απαιτεί βαθιά κατανόηση του prompt engineering και ισχυρή συντακτική/σκηνοθετική κρίση. Ο κίνδυνος να κατακλυστεί το τοπικό διαδίκτυο από οπτικά εντυπωσιακά αλλά κενά περιεχομένου βίντεο είναι απολύτως υπαρκτός.