up_icon
Technology

Η Τεχνητή Νοημοσύνη της Baidu μιμείται με ακρίβεια τη φωνή σου, αρκεί να σε ακούσει για 1 λεπτό!

15 Μαρτίου 2018 Vangelis Kompos

Η Τεχνητή Νοημοσύνη της Baidu μιμείται με ακρίβεια τη φωνή σου, αρκεί να σε ακούσει για 1 λεπτό!

Η Baidu αποκαλείται πολλές φορές ως "η Google της Κίνας", καθώς εκτός από τη μηχανή αναζήτησης καταπιάνεται και αυτή με πολλούς διαφορετικούς τομείς της τεχνολογίας. Ένας από αυτούς είναι και η Τεχνητή Νοημοσύνη, με την εταιρεία να έχει αναπτύξει ένα σύστημα που μπορεί να μιμηθεί τη φωνή του χρήστη με ακρίβεια, αρκεί να την έχει ακούσει για περίπου 1 λεπτό!

Όπως δήλωσε στην ιστοσελίδα Digital Trends ο Leo Zou, εκπρόσωπος της Baidu,

"Από τεχνικής σκοπιάς είναι ένα πολύ σημαντικό επίτευγμα που αποδεικνύει ότι ένα πολύπλοκο πρόβλημα όπως είναι η σύνθεση ομιλίας, μπορεί να επιλυθεί με τη χρήση ενός πολύ μικρού δείγματος. Παλαιότερα, η εκμάθηση απαιτούσε πολύωρη εκπαίδευση της Τεχνητής Νοημοσύνης και όχι με τόσο ακριβή αποτελέσματα"

Να σημειωθεί, βέβαια, ότι η τεχνολογία φωνητικής σύνθεσης της Baidu δεν είναι απόλυτα πειστική στο τελικό αποτέλεσμα, αλλά βρίσκεται πολλά βήματα μπροστά από οτιδήποτε έχουμε ακούσει μέχρι σήμερα από άλλες παρόμοιες τεχνολογίες. Το project βασίστηκε στο σύστημα Deep Voice της Baidu, το οποίο έχει εκπαιδευτεί για περίπου 800 ώρες. Κανονικά χρειάζεται να ακούσει 100 ηχητικά διάρκειας 5 δευτερολέπτων για να ακούγεται στην καλύτερη δυνατή κατάσταση, αλλά μια έκδοση της τεχνολογίας εκπαιδεύτηκε με μόλις 10 τέτοια δείγματα (διάρκειας 5 δευτερολέπτων το καθένα) και κατάφερε να ξεγελάσει ένα σύστημα αναγνώρισης φωνής 95 στις 100 φορές!

Ο Leo Zou συνέχισε αναφέροντας:

"Οι πιθανές εφαρμογές της τεχνολογίας είναι πολλές και εντυπωσιακές. Για παράδειγμα, θα μπορούσαμε να κλωνοποιήσουμε τη φωνή ασθενών που έχουν χάσει τη φωνή τους ή να φτιάξουμε custom audiobooks που θα διαβάζουν βιβλία στα παιδιά με τη φωνή της μητέρας τους. Ακόμη, είναι εφικτή η δημιουργία original περιεχομένου, αφού εκατοντάδες χαρακτήρες σε ένα video game θα μπορούσαν να έχουν μοναδικές φωνές. Μια άλλη ενδιαφέρουσα εφαρμογή θα μπορούσε να είναι η μεταγλώττιση σε πραγματικό χρόνο της ομιλίας (βλ. Skype Translator) με τη φωνή του ομιλητή"

Μπορείτε να ακούσετε δείγματα της τεχνολογίας της Baidu από εδώ.

[via]

Vangelis Kompos

Έχει επαφή με τα κομπιούτερζ από όταν απέκτησε πιτσιρικάς ένα Sinclair ZX81 με ένα ολόκληρο Kbyte μνήμης Ram, μπούκαρε στα ίντερνετς από την εποχή των BBS και των modem 1200bps.
Αποτελεί πλέον προστατευόμενο είδος καθώς επιμένει να λατρεύει τα windows, να μένει μακριά από μήλα οποιασδήποτε μορφής και να χρησιμοποιεί κουρδιστό μηχανικό ρολόι. Τρέχα γύρευε…

ΣΧΟΛΙΑ
read more

Samsung 6G Forum: Παρακολουθήστε ζωντανά το πρώτο συνέδριο για τα δίκτυα 6G

13 Μαΐου 2022 Techgear Team

Η Samsung ανακοινώνει τη διοργάνωση του πρώτου Samsung 6G Forum (S6GF), που διεξάγεται διαδικτυακά. Το Forum, με θέμα «The Next Hyper-Connected Experience for All», χωρίζεται σε δύο μέρη και μεταδίδεται ζωντανά...

Vodafone Smart Forest: Το πρώτο «έξυπνο» δάσος στην Ελλάδα

12 Μαΐου 2022 Techgear Team

H Vodafone Ελλάδας παρουσιάζει το πρώτο «έξυπνο» δάσος της Ελλάδας στην Πάρνηθα. Το Smart Forest, χρησιμοποιώντας τις τεχνολογίες και το δίκτυο της Vodafone, θα μπορεί να εντοπίσει γρήγορα και έγκαιρα τυχόν ...

Google Search: Η αναζήτηση πηγαίνει στο επόμενο επίπεδο με τα νέα εργαλεία της εταιρείας

11 Μαΐου 2022 Christos Elpidis

Τον περασμένο μήνα ξεκίνησαν οι δοκιμές του περίφημου multisearch της Google που εμπλέκει στη διαδικασία της αναζήτησης ταυτόχρονα την εικόνα και το κείμενο με τη βοήθεια του εργαλείου Google Lens. Τώρα, στο ...

Samsung: Το μέλλον της τεχνολογίας Micro LED σε τρία νέα μοντέλα της οθόνης The Wall

10 Μαΐου 2022 Techgear Team

Η Samsung παρουσιάζει το μέλλον της τεχνολογίας Micro LED στη διεθνή έκθεση Integrated Systems Europe (ISE) 2022 στη Βαρκελώνη, με τρία νέα μοντέλα της υπερσύγχρονης οθόνης της, The Wall. 2022 The Wall – ...

Αδιανόητο demo της Unreal Engine 5, ξεχνάς τι είναι αληθινό και τι όχι

10 Μαΐου 2022 Christos Elpidis

Μια ακόμη γεύση από τις δυνατότητες της Unreal Engine 5 μας δίνει η δημιουργία του Lorenzo Drago, ο οποίος χρησιμοποίησε την τελευταία έκδοση της gaming engine της Epic Games για να δημιουργήσει τον ...

Η Samsung αποκαλύπτει τα ευρήματα της έρευνας της για τα δίκτυα 6G

09 Μαΐου 2022 Techgear Team

Η Samsung δημοσίευσε τη Λευκή Βίβλο που αναπτύσσει το όραμα της εταιρείας για την εξασφάλιση παγκόσμιων ζωνών συχνοτήτων 6G, την τεχνολογία επικοινωνίας επόμενης γενιάς. Η Λευκή Βίβλος με τίτλο «6G Spectrum: ...

WiFi- 7: Ταχύτητες έως 33Gbps ήδη από το 2023 ισχυρίζεται η Qualcomm

05 Μαΐου 2022 Christos Elpidis

Δεν θα προλάβουν να…γεράσουν τα πρωτόκολλα Wi-Fi 6 και Wi-Fi 6E, καθώς οι κατασκευαστές τρέχουν ήδη για να λανσάρουν την επόμενη γενιά που θα υπερτριπλασιάσει την ταχύτητα αναμετάδοσης των δεδομένων μέσα στο ...

Samsung: Ανακοίνωσε τον πρώτο αποθηκευτικό χώρο UFS 4.0

04 Μαΐου 2022 Christos Elpidis

Η Samsung ετοιμάζεται για το λανσάρισμα των foldables νέας γενιάς για το 2022 και μία από τις καινοτομίες που θα δούμε σε αυτά θα είναι η ενσωμάτωση αποθηκευτικού χώρου νέας τεχνολογίας. Η εταιρεία ανακοίνωσε ...

E Ink Gallery 3: Η νέα έγχρωμη οθόνη για eReaders

29 Απριλίου 2022 Christos Elpidis

Είναι γεγονός ότι τα eReaders δεν έχουν περπατήσει ιδιαίτερα καλά στην χώρα μας, καθώς οι περισσότεροι επιλέγουν κάποιο tablet για αυτήν την δουλειά, αλλά στο εξωτερικό η κατάσταση είναι αρκετά διαφορετική και ...

Apple: Ένα ακόμη βήμα πιο κοντά στην υποχρεωτική χρήση υποδοχής USB-C

25 Απριλίου 2022 Christos Elpidis

Σίγουρα το έχουμε ακούσει πολλές φορές τα τελευταία χρόνια, αλλά όσο περνούν οι μήνες και αυξάνεται περισσότερο η πίεση στην Apple από την Ευρωπαϊκή Ένωση προκειμένου να χρησιμοποιήσει και αυτή υποδοχές USB-C ...

Loader
techgear_icon