Η ElevenLabs αναβιώνει τη φωνή του Stan Lee μέσω AI για audiobooks και εφαρμογές!
Σύνοψη
- Η ElevenLabs προχώρησε σε επίσημη συμφωνία με τη Stan Lee Universe (Genius Brands / POW! Entertainment) για την αδειοδότηση της φωνής και της εικόνας του θρυλικού δημιουργού της Marvel.
- Η εκπαίδευση του generative AI μοντέλου πραγματοποιήθηκε αποκλειστικά μέσω εγκεκριμένων, επαγγελματικών ηχογραφήσεων και όχι μέσω ανεξέλεγκτης συλλογής δεδομένων.
- Η φωνή του Stan Lee εντάσσεται στο Iconic Marketplace, συμπληρώνοντας τον κατάλογο που περιλαμβάνει ονόματα όπως η Judy Garland, ο John Wayne και ο James Earl Jones.
- Η πρόσβαση στην AI φωνή του πραγματοποιείται μέσω της εφαρμογής ElevenReader, διαθέσιμη στα Google Play Store και App Store.
- Η χρήση της εικόνας του περιορίζεται αυστηρά σε μη εμπορικούς σκοπούς μέσω του ElevenCreative AI, προστατεύοντας την εμπορική του ταυτότητα.
Η ElevenLabs ανακοίνωσε την επίσημη συνεργασία της με τη Stan Lee Universe και ο συνδημιουργός εμβληματικών χαρακτήρων όπως οι Spider-Man, X-Men και Iron Man, ο οποίος απεβίωσε το 2018 σε ηλικία 95 ετών, μετατρέπεται πλέον σε ψηφιακή οντότητα. Μέσα από αυστηρά ρυθμισμένα μοντέλα αδειοδότησης, η φωνή του είναι πλέον διαθέσιμη για την αφήγηση ηχητικών βιβλίων και την ενσωμάτωση σε ψηφιακές πλατφόρμες.
Η εταιρεία εκπαίδευσε το AI μοντέλο της χρησιμοποιώντας αποκλειστικά επαγγελματικές ηχογραφήσεις του Stan Lee. Η ψηφιακή φωνή ενσωματώνεται στο Iconic Marketplace και στο ElevenReader app, επιτρέποντας την εκφώνηση κειμένων, ενώ η χρήση της εικόνας του περιορίζεται αυστηρά σε μη εμπορικές, οπτικές εφαρμογές.
Η τεχνική προσέγγιση της ElevenLabs εστιάζει στην ποιότητα των δεδομένων εισόδου. Σύμφωνα με τα τεχνικά δεδομένα της πλατφόρμας, το μοντέλο εκπαιδεύτηκε πάνω σε αμιγώς καθαρά δείγματα φωνής, απαλλαγμένα από θόρυβο παρασκηνίου ή μουσική υπόκρουση. Αυτή η επιλογή αποτρέπει τις ακουστικές παραισθήσεις που παρατηρούνται συχνά σε open-source μοντέλα TTS (Text-to-Speech) τα οποία βασίζονται σε scraping από βίντεο χαμηλής ποιότητας. Η αρχιτεκτονική του νευρωνικού δικτύου της ElevenLabs αναλύει τον τονισμό, τον ρυθμό, την αναπνοή και τη χαρακτηριστική χροιά του Stan Lee, αποδίδοντας ένα αποτέλεσμα που διατηρεί τη χαρακτηριστική ενέργεια του δημιουργού.
Το μοντέλο αδειοδότησης: Διαχείριση ψηφιακής κληρονομιάς
Η ένταξη του Stan Lee στο Iconic Marketplace της ElevenLabs αποτελεί ένα σημείο αναφοράς για τα πνευματικά δικαιώματα στην εποχή της τεχνητής νοημοσύνης. Η συμφωνία υλοποιήθηκε σε συνεργασία με την Kartoon Studios και την POW! Entertainment, τις εταιρείες που διαχειρίζονται τα δικαιώματα του Lee. Ο μηχανισμός λειτουργεί μέσω εγκεκριμένων εφαρμογών, ούτως ώστε οι εταιρείες παραγωγής που επιθυμούν να χρησιμοποιήσουν τη φωνή του Lee για διαφημίσεις, τηλεοπτικά σποτ ή κινηματογραφικές παραγωγές να πρέπει να λάβουν ξεχωριστή νομική έγκριση από το Stan Lee Universe.
Αυτή η δομή αδειοδότησης δημιουργεί ένα νομικό «τείχος προστασίας» απέναντι στην ανεξέλεγκτη χρήση και προστατεύει την εμπορική αξία του ονόματος, δίνοντας το παράδειγμα για το πώς μπορούν να διαχειριστούν οι κληρονόμοι το IP των διασημοτήτων.
Διαθεσιμότητα του ElevenReader
Η εφαρμογή ElevenReader είναι διαθέσιμη στο App Store και στο Google Play, επιτρέποντας στους χρήστες να ανεβάζουν αρχεία κειμένου (PDF, ePub) ή να επικολλούν άρθρα από το διαδίκτυο και να τα ακούν μέσω AI-generated φωνών.
Η πολιτική τιμολόγησης της ElevenLabs είναι ενοποιημένη παγκοσμίως. Προσφέρονται 10 ώρες δωρεάν χρήσης text-to-audio κάθε μήνα, γεγονός που καλύπτει τις ανάγκες του μέσου ακροατή για την ανάγνωση ειδήσεων. Αξίζει να σημειωθεί πως το μοντέλο της ElevenLabs υποστηρίζει άριστα την ελληνική γλώσσα, ωστόσο η φωνή του Stan Lee, λόγω της φύσης του training data, λειτουργεί βέλτιστα και πειστικά κυρίως στην απόδοση αγγλικών κειμένων, καθώς η προφορά ελληνικών λέξεων από ένα αγγλόφωνο φωνητικό μοντέλο δημιουργεί έντονη ξενική προφορά.
ElevenReader - [Google Play Store Link]
ElevenReader - [App Store Link]