up_icon
Technology

Η Τεχνητή Νοημοσύνη της Baidu μιμείται με ακρίβεια τη φωνή σου, αρκεί να σε ακούσει για 1 λεπτό!

15 Μαρτίου 2018 Vangelis Kompos

Η Τεχνητή Νοημοσύνη της Baidu μιμείται με ακρίβεια τη φωνή σου, αρκεί να σε ακούσει για 1 λεπτό!

Η Baidu αποκαλείται πολλές φορές ως "η Google της Κίνας", καθώς εκτός από τη μηχανή αναζήτησης καταπιάνεται και αυτή με πολλούς διαφορετικούς τομείς της τεχνολογίας. Ένας από αυτούς είναι και η Τεχνητή Νοημοσύνη, με την εταιρεία να έχει αναπτύξει ένα σύστημα που μπορεί να μιμηθεί τη φωνή του χρήστη με ακρίβεια, αρκεί να την έχει ακούσει για περίπου 1 λεπτό!

Όπως δήλωσε στην ιστοσελίδα Digital Trends ο Leo Zou, εκπρόσωπος της Baidu,

"Από τεχνικής σκοπιάς είναι ένα πολύ σημαντικό επίτευγμα που αποδεικνύει ότι ένα πολύπλοκο πρόβλημα όπως είναι η σύνθεση ομιλίας, μπορεί να επιλυθεί με τη χρήση ενός πολύ μικρού δείγματος. Παλαιότερα, η εκμάθηση απαιτούσε πολύωρη εκπαίδευση της Τεχνητής Νοημοσύνης και όχι με τόσο ακριβή αποτελέσματα"

Να σημειωθεί, βέβαια, ότι η τεχνολογία φωνητικής σύνθεσης της Baidu δεν είναι απόλυτα πειστική στο τελικό αποτέλεσμα, αλλά βρίσκεται πολλά βήματα μπροστά από οτιδήποτε έχουμε ακούσει μέχρι σήμερα από άλλες παρόμοιες τεχνολογίες. Το project βασίστηκε στο σύστημα Deep Voice της Baidu, το οποίο έχει εκπαιδευτεί για περίπου 800 ώρες. Κανονικά χρειάζεται να ακούσει 100 ηχητικά διάρκειας 5 δευτερολέπτων για να ακούγεται στην καλύτερη δυνατή κατάσταση, αλλά μια έκδοση της τεχνολογίας εκπαιδεύτηκε με μόλις 10 τέτοια δείγματα (διάρκειας 5 δευτερολέπτων το καθένα) και κατάφερε να ξεγελάσει ένα σύστημα αναγνώρισης φωνής 95 στις 100 φορές!

Ο Leo Zou συνέχισε αναφέροντας:

"Οι πιθανές εφαρμογές της τεχνολογίας είναι πολλές και εντυπωσιακές. Για παράδειγμα, θα μπορούσαμε να κλωνοποιήσουμε τη φωνή ασθενών που έχουν χάσει τη φωνή τους ή να φτιάξουμε custom audiobooks που θα διαβάζουν βιβλία στα παιδιά με τη φωνή της μητέρας τους. Ακόμη, είναι εφικτή η δημιουργία original περιεχομένου, αφού εκατοντάδες χαρακτήρες σε ένα video game θα μπορούσαν να έχουν μοναδικές φωνές. Μια άλλη ενδιαφέρουσα εφαρμογή θα μπορούσε να είναι η μεταγλώττιση σε πραγματικό χρόνο της ομιλίας (βλ. Skype Translator) με τη φωνή του ομιλητή"

Μπορείτε να ακούσετε δείγματα της τεχνολογίας της Baidu από εδώ.

[via]

Vangelis Kompos

Έχει επαφή με τα κομπιούτερζ από όταν απέκτησε πιτσιρικάς ένα Sinclair ZX81 με ένα ολόκληρο Kbyte μνήμης Ram, μπούκαρε στα ίντερνετς από την εποχή των BBS και των modem 1200bps.
Αποτελεί πλέον προστατευόμενο είδος καθώς επιμένει να λατρεύει τα windows, να μένει μακριά από μήλα οποιασδήποτε μορφής και να χρησιμοποιεί κουρδιστό μηχανικό ρολόι. Τρέχα γύρευε…

ΣΧΟΛΙΑ
read more

Ψηφιακός βοηθός Alexa με τη φωνή οποιοδήποτε ο νέος στόχος της Amazon

23 Ιουνίου 2022 Christos Elpidis

Στο πλαίσιο του συνεδρίου MARS (Machine learning, Automation, Robotics, Space) που διεξάγεται αυτήν την εβδομάδα στο Las Vegas, ο αντιπρόεδρος της Amazon, Rohit Prasad, δήλωσε πως στόχος της εταιρείας είναι να ...

PCIe 7.0: Το νέο πρότυπο υπόσχεται τρομερές βελτιώσεις στην ταχύτητα

22 Ιουνίου 2022 Christos Elpidis

Έφτασε η ώρα να μάθουμε για την επόμενη γενιά του προτύπου PCIe, καθώς το PCI-SIG ανακοίνωσε επίσημα τις βασικές προδιαγραφές της έκδοσης PCIe 7.0 (ή PCIe Gen7) στο πλαίσιο του συνεδρίου PCI-SIG Developers ...

HONDA Striemo: Το νέο ηλεκτρικό πατίνι με μηχανισμό υποβοήθησης ισορροπίας

15 Ιουνίου 2022 Techgear Team

Η Striemo Inc. έχει αναπτύξει ένα τρίτροχο, ηλεκτρικό προϊόν μικροκινητικότητας για ένα άτομο, με την ονομασία “Striemo”. Αυτό διαθέτει έναν πρωτότυπο μηχανισμό υποβοήθησης ισορροπίας ο οποίος επιτρέπει σταθερή...

LG: Έξυπνη κινητικότητα και τεχνολογία 6G στο συνέδριο IEEE 2022

08 Ιουνίου 2022 Techgear Team

Η LG παρουσίασε μια μεγάλη γκάμα καινοτόμων, νέων τεχνολογιών κινητικότητας, συμπεριλαμβανομένων λύσεων συνδεδεμένων οχημάτων που αξιοποιούν το 6G και την Τεχνητή Νοημοσύνη (AI), στο Διεθνές Συνέδριο ...

Επίσημο: Υποχρεωτική η υποδοχή USB-C από το 2024 (και για τα iPhone)

07 Ιουνίου 2022 Christos Elpidis

Το περίφημο νομοσχέδιο της ΕΕ που θα υποχρεώσει όλους τους κατασκευαστές ηλεκτρονικών συσκευών να υιοθετήσουν την υποδοχή USB-C βρίσκεται πιο κοντά από ποτέ στο να πάρει την τελική μορφή του, καθώς η αρμόδια ...

Η νέα γενιά δημιουργεί καινοτόμες εφαρμογές ρομποτικής για έναν πιο βιώσιμο κόσμο

07 Ιουνίου 2022 Techgear Team

Με δημιουργικότητα, φαντασία, θετική ενέργεια και ελπίδα για το μέλλον γέμισαν περισσότεροι από 1.200 μαθητές πρωτοβάθμιας και δευτεροβάθμιας εκπαίδευσης το Εθνικό Αθλητικό Προπονητικό Κέντρο Ολυμπιακού Χωριού,...

Frontier: Ο ταχύτερος υπερυπολογιστής exascale στον κόσμο

06 Ιουνίου 2022 Techgear Team

Η Hewlett Packard Enterprise ανακοίνωσε ότι ο Frontier, o νέος υπερυπολογιστής που κατασκεύασε η HPE για το Oak Ridge National Laboratory (ORNL) του Υπουργείου Ενέργειας των ΗΠΑ, έφτασε τα 1,1 exaflops, ...

Samsung: Επεκτείνει το σύστημα «Paper-free» σε 11.000 κέντρα υπηρεσιών παγκοσμίως

03 Ιουνίου 2022 Techgear Team

Η Samsung ανακοίνωσε το ολοκληρωμένο παγκόσμιο σύστημα εξυπηρέτησης πελατών της, ως μέρος της συνεχούς δέσμευσής της για την ανάπτυξη βιώσιμων πρακτικών. Το σύστημα στοχεύει στη μετάβαση από τα έντυπα που ...

Microsoft Build 2022: Όλα όσα έγιναν στο συνέδριο της Microsoft

31 Μαΐου 2022 Techgear Team

Το Microsoft Build 2022, το μεγαλύτερο συνέδριο της Microsoft που απευθύνεται σε developers, ολοκληρώθηκε και φέτος με ανακοινώσεις που έφεραν νέα δεδομένα στην κοινότητα των προγραμματιστών και όσων ...

IMAGEN: Το απίστευτο AI εργαλείο που δημιουργεί εικόνες από σύντομες περιγραφές

27 Μαΐου 2022 Christos Elpidis

Η Google εντυπωσιάζει για μια ακόμη φορά με τις δυνατότητες των αλγορίθμων Τεχνητής Νοημοσύνης παρουσιάζοντας εικόνες που δημιουργήθηκαν από μια σύντομη περιγραφή με το εργαλείο IMAGEN. Το τελικό αποτέλεσμα ...

Loader
techgear_icon