up_icon
Technology

Η Τεχνητή Νοημοσύνη της Baidu μιμείται με ακρίβεια τη φωνή σου, αρκεί να σε ακούσει για 1 λεπτό!

15 Μαρτίου 2018 Vangelis Kompos

Η Τεχνητή Νοημοσύνη της Baidu μιμείται με ακρίβεια τη φωνή σου, αρκεί να σε ακούσει για 1 λεπτό!

Η Baidu αποκαλείται πολλές φορές ως "η Google της Κίνας", καθώς εκτός από τη μηχανή αναζήτησης καταπιάνεται και αυτή με πολλούς διαφορετικούς τομείς της τεχνολογίας. Ένας από αυτούς είναι και η Τεχνητή Νοημοσύνη, με την εταιρεία να έχει αναπτύξει ένα σύστημα που μπορεί να μιμηθεί τη φωνή του χρήστη με ακρίβεια, αρκεί να την έχει ακούσει για περίπου 1 λεπτό!

Όπως δήλωσε στην ιστοσελίδα Digital Trends ο Leo Zou, εκπρόσωπος της Baidu,

"Από τεχνικής σκοπιάς είναι ένα πολύ σημαντικό επίτευγμα που αποδεικνύει ότι ένα πολύπλοκο πρόβλημα όπως είναι η σύνθεση ομιλίας, μπορεί να επιλυθεί με τη χρήση ενός πολύ μικρού δείγματος. Παλαιότερα, η εκμάθηση απαιτούσε πολύωρη εκπαίδευση της Τεχνητής Νοημοσύνης και όχι με τόσο ακριβή αποτελέσματα"

Να σημειωθεί, βέβαια, ότι η τεχνολογία φωνητικής σύνθεσης της Baidu δεν είναι απόλυτα πειστική στο τελικό αποτέλεσμα, αλλά βρίσκεται πολλά βήματα μπροστά από οτιδήποτε έχουμε ακούσει μέχρι σήμερα από άλλες παρόμοιες τεχνολογίες. Το project βασίστηκε στο σύστημα Deep Voice της Baidu, το οποίο έχει εκπαιδευτεί για περίπου 800 ώρες. Κανονικά χρειάζεται να ακούσει 100 ηχητικά διάρκειας 5 δευτερολέπτων για να ακούγεται στην καλύτερη δυνατή κατάσταση, αλλά μια έκδοση της τεχνολογίας εκπαιδεύτηκε με μόλις 10 τέτοια δείγματα (διάρκειας 5 δευτερολέπτων το καθένα) και κατάφερε να ξεγελάσει ένα σύστημα αναγνώρισης φωνής 95 στις 100 φορές!

Ο Leo Zou συνέχισε αναφέροντας:

"Οι πιθανές εφαρμογές της τεχνολογίας είναι πολλές και εντυπωσιακές. Για παράδειγμα, θα μπορούσαμε να κλωνοποιήσουμε τη φωνή ασθενών που έχουν χάσει τη φωνή τους ή να φτιάξουμε custom audiobooks που θα διαβάζουν βιβλία στα παιδιά με τη φωνή της μητέρας τους. Ακόμη, είναι εφικτή η δημιουργία original περιεχομένου, αφού εκατοντάδες χαρακτήρες σε ένα video game θα μπορούσαν να έχουν μοναδικές φωνές. Μια άλλη ενδιαφέρουσα εφαρμογή θα μπορούσε να είναι η μεταγλώττιση σε πραγματικό χρόνο της ομιλίας (βλ. Skype Translator) με τη φωνή του ομιλητή"

Μπορείτε να ακούσετε δείγματα της τεχνολογίας της Baidu από εδώ.

[via]

Vangelis Kompos

Έχει επαφή με τα κομπιούτερζ από όταν απέκτησε πιτσιρικάς ένα Sinclair ZX81 με ένα ολόκληρο Kbyte μνήμης Ram, μπούκαρε στα ίντερνετς από την εποχή των BBS και των modem 1200bps.
Αποτελεί πλέον προστατευόμενο είδος καθώς επιμένει να λατρεύει τα windows, να μένει μακριά από μήλα οποιασδήποτε μορφής και να χρησιμοποιεί κουρδιστό μηχανικό ρολόι. Τρέχα γύρευε…

ΣΧΟΛΙΑΣΤΕ
ΣΧΟΛΙΑ
read more

Η Samsung δείχνει το μέλλον των foldables με έναν νέο μεντεσέ 360°

01 Φεβρουαρίου 2023 Christos Elpidis

Η σημερινή ημέρα είναι αφιερωμένη φυσικά στην παρουσίαση της σειράς Samsung Galaxy S23 και των νέων laptops της εταιρείας με οθόνη OLED (Samsung Galaxy Book3), αλλά αυτό δεν μας εμποδίζει να ρίξουμε μια ματιά ...

Samsung: Οι νέες έξυπνες λύσεις ψηφιακής σήμανσης στην ISE 2023

31 Ιανουαρίου 2023 Techgear Team

Η Samsung παρουσιάζει το μέλλον της βιώσιμης ψηφιακής σήμανσης στην έκθεση Integrated Systems Europe (ISE) 2023 στη Βαρκελώνη, με νέες τεχνολογίες και οικολογικές προσπάθειες, στο πλαίσιο της νέας ...

Πώς το ChatGPT αλλάζει τον κόσμο της κυβερνοασφάλειας

26 Ιανουαρίου 2023 Techgear Team

Η Kaspersky διερευνά τον τρόπο με τον οποίο η ικανότητα πρόσβασης του ευρύτερου κοινού στο ChatGPT ενδέχεται να μεταβάλει τους καθιερωμένους κανόνες του κόσμου της κυβερνοασφάλειας. Η διερεύνηση αυτή ...

Χρήση laser ως αλεξικέραυνο για πολύ μεγαλύτερη εμβέλεια και καλύτερη απόδοση

26 Ιανουαρίου 2023 Christos Elpidis

Η χρήση αλεξικέραυνου για την ασφαλή «απορρόφηση» των κεραυνών δεν είναι σαφέστατα κάτι καινούργιο, καθώς οι άνθρωποι τοποθετούν αυτές τις «ταπεινές» μεταλλικές ράβδους σε υψηλά σημεία εδώ και αιώνες για να ...

Η Samsung ετοιμάζει OLED panels αφής και για τα νέα laptops της

25 Ιανουαρίου 2023 Christos Elpidis

Η Samsung σκοπεύει να επεκτείνει την χρήση των προηγμένων OLED panels αφής που χρησιμοποιεί στα smartphones της και στην κατηγορία των laptops, καθώς το τμήμα Samsung Display ανακοίνωσε την έναρξη της μαζικής ...

Atlas: Το ανθρωποειδές ρομπότ έχει εξελιχθεί ασύλληπτα στο νέο video της Boston Dynamics

19 Ιανουαρίου 2023 Christos Elpidis

Η Boston Dynamics δημοσίευσε ένα νέο video για να μας δείξει την πρόοδο που έχει σημειωθεί στην ανάπτυξη του ανθρωποειδούς ρομπότ Atlas, το οποίο έχει αρχίσει να ξεφεύγει σε σύγκριση με ό,τι έχουμε δει μέχρι ...

Samsung Neo QLED και Lifestyle, οι πρώτες τηλεοράσεις με πιστοποίηση για τον κιρκάδιο ρυθμό

12 Ιανουαρίου 2023 Techgear Team

Η Samsung ανακοίνωσε πως οι νέες τηλεοράσεις Neo QLED και Lifestyle TV 2023, απέκτησαν την πιστοποίηση ‘Circadian Rhythm Display’ από το Verband Deutscher Elektrotechniker (VDE), ένα κορυφαίο ινστιτούτο ...

Bullitt Satellite Connect: Σύστημα δορυφορικής επικοινωνίας και για το επόμενο motorola defy

10 Ιανουαρίου 2023 Techgear Team

Ο όμιλος Bullitt παρουσίασε την πολυσυζητημένη αμφίδρομη υπηρεσία δορυφορικών μηνυμάτων – Bullitt Satellite Connect – στην CES 2023. Η υπηρεσία θα είναι εμπορικά διαθέσιμη το 1ο τρίμηνο του 2023. Η ...

VALL-E: Το νέο AI εργαλείο μιμείται με απίστευτη ακρίβεια την φωνή σου

10 Ιανουαρίου 2023 Christos Elpidis

Μια ακόμη πολύ εντυπωσιακή και αμφιλεγόμενη αξιοποίηση των δυνατοτήτων της Τεχνητής Νοημοσύνης (ή καλύτερα της Μηχανικής Μάθησης) ήρθε στη δημοσιότητα από ερευνητές της Microsoft. Ο λόγος για το VALL-E, ένα ...

Snapdragon Satellite: Δορυφορική επικοινωνία στα μελλοντικά Android smartphones και όχι μόνο

09 Ιανουαρίου 2023 Christos Elpidis

Ένα από τα χαρακτηριστικά που διαφήμισε αρκετά η Apple στην παρουσίαση των μοντέλων της σειράς iPhone 14 είναι η δυνατότητα επικοινωνίας με δορυφόρο, επομένως, δεν προκαλεί εντύπωση το γεγονός ότι το ...

Loader
please wait
techgear_icon