Η Google μετατρέπει το Gemini στον απόλυτο μουσικό παραγωγό!

Φανταστείτε να μπορούσατε να «ακούσετε» μια φωτογραφία ή να μετατρέψετε μια αστεία ανάμνηση σε ένα πλήρες τραγούδι 30 δευτερολέπτων με στίχους, μουσική και εξώφυλλο, όλα μέσα σε λίγα δευτερόλεπτα. Αυτό που μέχρι χθες φάνταζε ως ένα ακόμα πείραμα στα εργαστήρια της DeepMind, σήμερα γίνεται πραγματικότητα για εκατομμύρια χρήστες. Η Google ανακοίνωσε επίσημα την ενσωμάτωση του Lyria 3, του πιο εξελιγμένου μοντέλου παραγωγής μουσικής της, απευθείας στο Gemini app, αλλάζοντας τα δεδομένα στο χώρο της παραγωγής ήχου.

Από το κείμενο και την εικόνα, στην παρτιτούρα

Το Lyria 3 δεν είναι απλώς μια αναβάθμιση «στα σημεία». Η ουσιαστική διαφορά σε σχέση με τις προηγούμενες εκδόσεις (που είχαμε δει πειραματικά το 2023 και το 2024) εντοπίζεται στην πολυπλοκότητα και την αυτονομία του μοντέλου. Πλέον, ο χρήστης δεν χρειάζεται να είναι στιχουργός. Το Gemini αναλαμβάνει να γράψει τους στίχους βασισμένο στο prompt σας, να συνθέσει τη μελωδία, να επιλέξει τα φωνητικά και να ορίσει τον ρυθμό.

Η διαδικασία είναι εντυπωσιακά απλή και, το κυριότερο, πολυτροπική. Μπορείτε να περιγράψετε ένα «κωμικό R&B κομμάτι για μια κάλτσα που βρήκε το ταίρι της» ή, ακόμα πιο ενδιαφέρον, να ανεβάσετε μια φωτογραφία από την τελευταία σας πεζοπορία και να ζητήσετε από το AI να «μελοποιήσει» την εικόνα. Το αποτέλεσμα είναι ένα κλιπ 30 δευτερολέπτων, συνοδευόμενο μάλιστα από custom εξώφυλλο που δημιουργεί το νέο μοντέλο Nano Banana – μια ενδιαφέρουσα προσθήκη στο οικοσύστημα της Google που φαίνεται να ειδικεύεται σε γρήγορα, stylized εικαστικά.

Τεχνική υπεροχή και ενσωμάτωση στο YouTube

Για τους tech enthusiasts που μας διαβάζουν, η τεχνική ανωτερότητα του Lyria 3 φαίνεται στον έλεγχο. Σε αντίθεση με τα "black box" μοντέλα του παρελθόντος, εδώ η Google υπόσχεται γραμμικό έλεγχο στο στυλ και το ρυθμό. Το μοντέλο κατανοεί βαθύτερες μουσικές δομές, παράγοντας αποτελέσματα που ακούγονται λιγότερο «ρομποτικά» και περισσότερο σαν παραγωγές από ανθρώπινο χέρι.

Φυσικά, η Google δεν θα άφηνε το YouTube εκτός παιχνιδιού. Η λειτουργία Dream Track, που επιτρέπει στους δημιουργούς Shorts να παράγουν μοναδικά soundtracks, επεκτείνεται πλέον και εκτός ΗΠΑ, δίνοντας ένα τεράστιο πλεονέκτημα στους creators που θέλουν original ήχο χωρίς τον φόβο των copyright strikes.

Το ζήτημα της ασφάλειας: SynthID και ηθική AI

Σε μια εποχή όπου τα deepfakes ήχου αποτελούν σοβαρή απειλή, η Google θωρακίζει το Lyria 3 με το SynthID. Κάθε κομμάτι που παράγεται φέρει μια ανεπαίσθητη, ψηφιακή υδατογράφηση (watermark) που επιτρέπει την ταυτοποίησή του ως περιεχόμενο AI. Μάλιστα, το Gemini αποκτά πλέον τη δυνατότητα να ελέγχει αρχεία ήχου που ανεβάζετε και να σας ενημερώνει αν έχουν δημιουργηθεί από τα εργαλεία της Google, ενισχύοντας τη διαφάνεια.

Επιπλέον, υπάρχουν δικλείδες ασφαλείας για την αποφυγή μίμησης συγκεκριμένων καλλιτεχνών. Αν ζητήσετε ένα τραγούδι «στυλ Weeknd», το σύστημα θα το χρησιμοποιήσει ως γενική καλλιτεχνική κατεύθυνση, αλλά δεν θα κλωνοποιήσει τη φωνή του, προστατεύοντας τα πνευματικά δικαιώματα και τηρώντας τις υποσχέσεις που έδωσε η εταιρεία στη μουσική βιομηχανία.

Διαθεσιμότητα και συνδρομές

Η υπηρεσία είναι διαθέσιμη από σήμερα σε beta μορφή για χρήστες άνω των 18 ετών. Αν και η ελληνική γλώσσα δεν υποστηρίζεται ακόμα εγγενώς για τη δημιουργία στίχων (το λανσάρισμα περιλαμβάνει Αγγλικά, Γερμανικά, Ισπανικά, Γαλλικά, Χίντι, Ιαπωνικά, Κορεάτικα και Πορτογαλικά), η πλατφόρμα είναι προσβάσιμη στην Ελλάδα και οι Έλληνες early adopters μπορούν να πειραματιστούν στα Αγγλικά.

Η διάθεση ξεκινά από το web (gemini.google.com) και θα ακολουθήσει το mobile app τις επόμενες ημέρες. Αξίζει να σημειωθεί ότι οι συνδρομητές των πακέτων Google AI Plus, Pro και Ultra θα έχουν αυξημένα όρια χρήσης, κάτι που αναμένεται να διαφοροποιήσει σημαντικά την εμπειρία για τους επαγγελματίες.

Η ματιά του Techgear

Το Lyria 3 αποτελεί ακόμα μία απόδειξη ότι η παραγωγική AI ωριμάζει. Από τα αστεία κλιπάκια, περνάμε σε εργαλεία που μπορούν να πλαισιώσουν επαγγελματικό περιεχόμενο στα social media. Για εμάς στο Techgear.gr, το ενδιαφέρον τώρα στρέφεται στο πώς θα αντιδράσει ο ανταγωνισμός (βλέπε OpenAI και Suno) και πότε θα δούμε την πλήρη υποστήριξη της ελληνικής γλώσσας.