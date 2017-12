Η τεχνολογία text-to-speech της Google έχει εξελιχθεί πλέον σε τέτοιο βαθμό που δύσκολα μπορείς να ξεχωρίσεις μια πραγματική φωνή από την φωνή του υπολογιστή. Η εταιρεία αποκάλυψε τη δεύτερη γενιά της τεχνολογίας Tacotron, η οποία βασίζεται σε δύο νευρωνικά δίκτυα. Το πρώτο μετατρέπει το γραπτό κείμενο σε φασματογράφημα (οπτική απεικόνιση των συχνοτήτων του ήχου), το οποίο στη συνέχεια περνά από το σύστημα WaveNet για να διαβαστεί και να αποδοθεί κάθε κυματομορφή σε ήχο.

Η ερευνητική ομάδα της Google έχει εκπαιδεύσει το σύστημα Tacotron 2 έτσι ώστε να αποδίδει σωστά δύσκολες φράσεις, να τονίζει τα κεφαλαία γράμματα, να διαβάζει λέξεις με ορθογραφικά λάθη, να απαγγέλει γλωσσοδέτες, να πραγματοποιεί παύσεις στα σημεία στίξης κλπ.

Μπορείτε να ακούσετε μερικά παραδείγματα στη συνέχεια (η δεύτερη φωνή είναι ο υπολογιστής):

“That girl did a video about Star Wars lipstick.”

Πολύπλοκες λέξεις

“Generative adversarial network or variational auto-encoder.”

“Basilar membrane and otolaryngology are not auto-correlations.”

Προφορά

“He has read the whole thing.”

“He reads books.”

“Don’t desert me here in the desert!”

“He thought it was time to present the present.”

Ανάγνωση με ορθογραφικά λάθη

“Thisss isrealy awhsome.”

Απόδοση σημείων στίξης

“This is your personal assistant, Google Home.”

“This is your personal assistant Google Home.” (χωρίς κόμμα)

Τονισμός των λέξεων με κεφαλαία γράμματα

“The buses aren’t the problem, they actually provide a solution.”

“The buses aren’t the PROBLEM, they actually provide a SOLUTION.”

Γλωσσοδέτες

“Peter Piper picked a peck of pickled peppers. How many pickled peppers did Peter Piper pick?”

“She sells sea-shells on the sea-shore. The shells she sells are sea-shells I’m sure.”

Αρκετά εντυπωσιακό, αν και θα πρέπει να σημειωθεί ότι το Tacotron 2 έχει εκπαιδευτεί μόνο στη συγκεκριμένη γυναικεία φωνή. Σε περίπτωση που θέλουν να προσθέσουν περισσότερες φωνές (π.χ. άλλη γυναικεια ή αντρική), θα πρέπει να εκπαιδευτεί το σύστημα ξανά από την αρχή.

