up_icon
Technology Xiaomi

Xiaomi: Ανέπτυξε τεχνολογία ομιλίας για να βοηθήσει άτομα με διαταραχές λόγου

19 Μαΐου 2022 Techgear Team

Xiaomi: Ανέπτυξε τεχνολογία ομιλίας για να βοηθήσει άτομα με διαταραχές λόγου

Η Xiaomi παρουσίασε την τελευταία της εφαρμογή προηγμένων αλγορίθμων και αυτοαναπτυσσόμενης τεχνολογίας ομιλίας στο πεδίο της προσβασιμότητας. Η τεχνολογία Text-to-Speech, η οποία αναπτύχθηκε από το Xiaomi AI Lab, χρησιμοποιείται για τη δημιουργία μιας μοναδικής και προσαρμοσμένης φωνής για χρήστες με διαταραχές λόγου.

Ο χρήστης μπορεί πλέον να επικοινωνεί με άλλα άτομα χρησιμοποιώντας τη «δική του φωνή» αντί για την τυποποιημένη ηλεκτρονική φωνή. Ως μέρος του προερευνητικού έργου "Own My Voice", επικεφαλής του οποίου είναι η Xiaomi Technical Committee, η επιτυχημένη αυτή προσπάθεια καταδεικνύει τη δέσμευση της Xiaomi στο "Tech for Good" και την επίτευξη του στόχου της «να μπορεί όλο ο κόσμος να απολαύσει μια καλύτερη ζωή μέσω καινοτόμων τεχνολογιών».

Γιατί η Xiaomi ξεκίνησε το έργο

H Xiaomi ενδιαφέρεται για τους ανθρώπους και προσπαθεί να καλύψει τις ποικίλες ανάγκες τους μέσω τεχνολογικών καινοτομιών. Στο πλαίσιο αυτό, ανακάλυψε την επιθυμία πολλών χρηστών με διαταραχές λόγου να αποκτήσουν τις δικές τους μοναδικές φωνές για την καθημερινή τους επικοινωνία και δημιούργησε την ομάδα "Own My Voice", η οποία προσκάλεσε έναν χρήστη με διαταραχές λόγου να αποκτήσει τη δική του φωνή. Ο Zhu Xi, μέλος της Επιτροπής Τεχνολογίας του Tech for Good στη Xiaomi Corporation, δήλωσε: 

Είμαστε ενθουσιασμένοι να εξερευνούμε πολλαπλές αξίες που μας προσφέρουν οι καινοτόμες τεχνολογίες, όπως η ανταπόκριση στις απαιτήσεις των χρηστών για την απόκτηση αλλά και τη δημιουργία της ταυτότητάς τους

Πώς η Xiaomi υλοποίησε το συγκεκριμένο έργο

Για να είναι σε θέση να παρέχει την καταλληλότερη και πιο εξατομικευμένη φωνή στον αποδέκτη, η ομάδα του project συνεργάστηκε με περισσότερους από 200 εθελοντές μέσα στη Xiaomi οι οποίοι δάνεισαν τις φωνές τους. Στη συνέχεια, χρησιμοποίησαν τον αλγόριθμο αντιστοίχισης φωνητικού αποτυπώματος, ώστε τα στοιχεία της φωνής του εθελοντή να ταιριάξουν με εκείνα της φωνής του αποδέκτη. Μέσω αυτής της προσέγγισης, βρήκαν την καταλληλότερη φωνή ως βασικό ήχο αναφοράς φωνής για τον παραλήπτη. Θέλοντας να προστατέψουν την προστασία της ιδιωτικότητας, κάθε επιλεγμένη αληθινή φωνή επεξεργάστηκε με πολύπλοκα ακουστικά μέσα, προκειμένου να παραχθεί ένας νέος μοναδικός ήχος φωνής. Σε επόμενο στάδιο, χρησιμοποίησαν την τεχνολογία άμεσης απόκρισης Text-To-Speech technology για να εκπαιδεύσουν το μοντέλο AI, κάνοντας αυτή τη νέα φωνή να αποκτήσει σταδιακά έναν φυσικό ρυθμό και τονισμό που μπορεί να εκφράσει με ειλικρίνεια τα συναισθήματα και τον τόνο ενός ανθρώπου. Το πρόγραμμα "Own My Voice" συνδυάζει μια ποικιλία από τους πιο εξελιγμένους αλγόριθμους ομιλίας που έχει δημιουργήσει η Xiaomi για να εξασφαλίσει την ιδιαιτερότητα, την ασφάλεια και την υψηλή γνησιότητα της συνθετικής φωνής, δημιουργώντας μια νέα ιδέα για την προσαρμοσμένη σύνθεση ομιλίας για χρήστες με διαταραχές λόγου.

Ποια είναι η σημασία αυτού του έργου

Η ραχοκοκαλιά αυτού του έργου αποτελείται από μία ομάδα ειδικών στην τεχνολογία ομιλίας από το Xiaomi ΑΙ Lab. Από το 2017 έχουν δημοσιεύσει 37 μελέτες σχετικά με την ομιλία στα πρακτικά κορυφαίων διεθνών συνεδρίων, όπως το Διεθνές Συνέδριο Ακουστικής, Ομιλίας και Επεξεργασίας Σήματος (ICASSP). Η επιτυχία του "Own My Voice" βασίζεται κυρίως στην τεχνολογία Text-to-Speech που αναπτύχθηκε από την ομάδα. Το αυθόρμητο στυλ της τεχνολογίας Text-To-Speech ουσιαστικά κάνει τη συνθετική φωνή να ακούγεται σαν αληθινή στον τονισμό, την παύση, την ταχύτητα και άλλα χαρακτηριστικά της. Αυτό αντικαθιστά τη μονότονη και αφύσικη αίσθηση της ηλεκτρονικής φωνής με μία πιο φυσική. Μέχρι στιγμής, η τεχνολογία αυτή είναι διαθέσιμη σε πολλές έξυπνες συσκευές εξοπλισμένες με το XiaoAI, τον φωνητικό βοηθό AI της Xiaomi.

Το έργο "Own My Voice" δείχνει ότι η τεχνολογία Text-to-Speech μπορεί επίσης να υιοθετηθεί ευρέως σε τομείς προσβασιμότητας και να βελτιώσει την εμπειρία του χρήστη. O Zhu Xi πρόσθεσε: 

Αν παρατηρήσουμε και καλύψουμε νωρίς τις ανάγκες των συνανθρώπων μας, η διαδικασία διάχυσης της τεχνολογίας θα μπορούσε να είναι σημαντικά πιο σύντομη. Αυτό δίνει τη δυνατότητα στα οφέλη των νέων τεχνολογιών να γίνουν προσβάσιμα σε ανθρώπους με αναπηρία χωρίς καμία καθυστέρηση

Προχωρώντας μπροστά, η Xiaomi θα συνεχίσει να ακούει τα σχόλια κάθε παραλήπτη φωνής και θα μελετήσει την πιθανή επέκταση του έργου σε ένα ευρύτερο φάσμα. Η Xiaomi θα συνεχίσει να στηρίζει την προσβασιμότητα μέσω νέων τεχνολογιών, προσπαθώντας να ικανοποιήσει τις διαφορετικές ανάγκες των ανθρώπων μέσω της τεχνολογικής καινοτομίας.

*Ακολουθήστε το Techgear.gr στο Google News για να ενημερώνεστε άμεσα για όλα τα νέα άρθρα!

Techgear Team

ΣΧΟΛΙΑ
read more

ΤΟΒi: ο ψηφιακός βοηθός της Vodafone πιο έξυπνος και αποτελεσματικός από ποτέ

28 Ιουνίου 2022 Techgear Team

Ο TOBi, ο ψηφιακός εικονικός «βοηθός» της Vodafone που έχει δημιουργηθεί για να δίνει στους πελάτες της τη δυνατότητα να βρουν λύσεις και απαντήσεις στα θέματα που τους απασχολούν, χωρίς να χρειάζεται να ...

Καλλιέργεια φυτών στο απόλυτο σκοτάδι χάριν στην τεχνητή φωτοσύνθεση

28 Ιουνίου 2022 Christos Elpidis

Ερευνητές του University of California κατάφεραν να βελτιώσουν την φυσική διαδικασία της φωτοσύνθεσης προκειμένου να ενισχύσουν την ανάπτυξη των φυτών, αλλά και να της επιτρέψουν να συμβεί ακόμη και στο ...

Ψηφιακός βοηθός Alexa με τη φωνή οποιοδήποτε ο νέος στόχος της Amazon

23 Ιουνίου 2022 Christos Elpidis

Στο πλαίσιο του συνεδρίου MARS (Machine learning, Automation, Robotics, Space) που διεξάγεται αυτήν την εβδομάδα στο Las Vegas, ο αντιπρόεδρος της Amazon, Rohit Prasad, δήλωσε πως στόχος της εταιρείας είναι να ...

PCIe 7.0: Το νέο πρότυπο υπόσχεται τρομερές βελτιώσεις στην ταχύτητα

22 Ιουνίου 2022 Christos Elpidis

Έφτασε η ώρα να μάθουμε για την επόμενη γενιά του προτύπου PCIe, καθώς το PCI-SIG ανακοίνωσε επίσημα τις βασικές προδιαγραφές της έκδοσης PCIe 7.0 (ή PCIe Gen7) στο πλαίσιο του συνεδρίου PCI-SIG Developers ...

HONDA Striemo: Το νέο ηλεκτρικό πατίνι με μηχανισμό υποβοήθησης ισορροπίας

15 Ιουνίου 2022 Techgear Team

Η Striemo Inc. έχει αναπτύξει ένα τρίτροχο, ηλεκτρικό προϊόν μικροκινητικότητας για ένα άτομο, με την ονομασία “Striemo”. Αυτό διαθέτει έναν πρωτότυπο μηχανισμό υποβοήθησης ισορροπίας ο οποίος επιτρέπει σταθερή...

LG: Έξυπνη κινητικότητα και τεχνολογία 6G στο συνέδριο IEEE 2022

08 Ιουνίου 2022 Techgear Team

Η LG παρουσίασε μια μεγάλη γκάμα καινοτόμων, νέων τεχνολογιών κινητικότητας, συμπεριλαμβανομένων λύσεων συνδεδεμένων οχημάτων που αξιοποιούν το 6G και την Τεχνητή Νοημοσύνη (AI), στο Διεθνές Συνέδριο ...

Επίσημο: Υποχρεωτική η υποδοχή USB-C από το 2024 (και για τα iPhone)

07 Ιουνίου 2022 Christos Elpidis

Το περίφημο νομοσχέδιο της ΕΕ που θα υποχρεώσει όλους τους κατασκευαστές ηλεκτρονικών συσκευών να υιοθετήσουν την υποδοχή USB-C βρίσκεται πιο κοντά από ποτέ στο να πάρει την τελική μορφή του, καθώς η αρμόδια ...

Η νέα γενιά δημιουργεί καινοτόμες εφαρμογές ρομποτικής για έναν πιο βιώσιμο κόσμο

07 Ιουνίου 2022 Techgear Team

Με δημιουργικότητα, φαντασία, θετική ενέργεια και ελπίδα για το μέλλον γέμισαν περισσότεροι από 1.200 μαθητές πρωτοβάθμιας και δευτεροβάθμιας εκπαίδευσης το Εθνικό Αθλητικό Προπονητικό Κέντρο Ολυμπιακού Χωριού,...

Frontier: Ο ταχύτερος υπερυπολογιστής exascale στον κόσμο

06 Ιουνίου 2022 Techgear Team

Η Hewlett Packard Enterprise ανακοίνωσε ότι ο Frontier, o νέος υπερυπολογιστής που κατασκεύασε η HPE για το Oak Ridge National Laboratory (ORNL) του Υπουργείου Ενέργειας των ΗΠΑ, έφτασε τα 1,1 exaflops, ...

Samsung: Επεκτείνει το σύστημα «Paper-free» σε 11.000 κέντρα υπηρεσιών παγκοσμίως

03 Ιουνίου 2022 Techgear Team

Η Samsung ανακοίνωσε το ολοκληρωμένο παγκόσμιο σύστημα εξυπηρέτησης πελατών της, ως μέρος της συνεχούς δέσμευσής της για την ανάπτυξη βιώσιμων πρακτικών. Το σύστημα στοχεύει στη μετάβαση από τα έντυπα που ...

Loader
techgear_icon