Android και Chrome ενισχύονται με AI λειτουργίες προσβασιμότητας

Με αφορμή την Παγκόσμια Ημέρα Ευαισθητοποίησης για την Προσβασιμότητα, η Google ανακοίνωσε μια σειρά από νέες λειτουργίες που βασίζονται στην τεχνητή νοημοσύνη, με στόχο να βελτιώσει την εμπειρία των χρηστών Android και Chrome, ιδίως εκείνων με προβλήματα όρασης ή ακοής. Η εταιρεία ενσωματώνει προηγμένα μοντέλα AI, όπως το Gemini, στις πλατφόρμες της, διευρύνοντας τη δυνατότητα αλληλεπίδρασης και κατανόησης του περιεχομένου για όλους.

Μια από τις σημαντικότερες αναβαθμίσεις αφορά το TalkBack, το πρόγραμμα ανάγνωσης οθόνης για Android. Πλέον, οι χρήστες μπορούν όχι μόνο να ακούνε περιγραφές εικόνων αλλά και να κάνουν ερωτήσεις παρακολούθησης σχετικά με το περιεχόμενο στην οθόνη τους. Για παράδειγμα, κατά την περιήγηση σε μια εφαρμογή αγορών, ο χρήστης μπορεί να ρωτήσει τον βοηθό Gemini από τι υλικό είναι κατασκευασμένο ένα ρούχο ή αν υπάρχει διαθέσιμη προσφορά για αυτό το προϊόν.

Παράλληλα, η Google ενισχύει και τη λειτουργία Expressive Captions, που παρουσιάστηκε το 2023 και προσφέρει σε πραγματικό χρόνο λεζάντες με φωνητικές αποχρώσεις. Χάρη στη χρήση τεχνητής νοημοσύνης, οι λεζάντες αποδίδουν πλέον και τον τρόπο με τον οποίο εκφέρονται οι λέξεις, όπως παρατεταμένες ή εμφατικές εκφράσεις. Έτσι, θα εμφανίζονται φράσεις όπως "nooooo" ή "amaaazing", μεταφέροντας καλύτερα το συναίσθημα του ομιλητή. Επιπλέον, προστίθενται νέα ηχητικά labels, όπως για σφυρίγματα ή καθαρίσματα λαιμού, εμπλουτίζοντας την εμπειρία για χρήστες με προβλήματα ακοής. Οι νέες Expressive Captions θα διατεθούν σε συσκευές με Android 15 στις ΗΠΑ, Ηνωμένο Βασίλειο, Καναδά και Αυστραλία.

Η εταιρεία συνεχίζει επίσης το έργο Project Euphonia, που στοχεύει στην ενίσχυση της αναγνώρισης φωνής για άτομα με άτυπα πρότυπα ομιλίας. Μέσα από ανοιχτού κώδικα εργαλεία στο GitHub, δίνει τη δυνατότητα σε προγραμματιστές να εκπαιδεύσουν μοντέλα ή να δημιουργήσουν προσαρμοσμένες εφαρμογές ήχου για περισσότερες φωνητικές παραλλαγές. Το έργο επεκτείνεται και στην Αφρική, σε συνεργασία με το Κέντρο Ψηφιακής Γλωσσικής Ένταξης, για τη βελτίωση της φωνητικής αναγνώρισης σε δέκα αφρικανικές γλώσσες.

Στον τομέα του Chrome και των Chromebook, η Google προσθέτει σημαντικές βελτιώσεις προσβασιμότητας. Οι μαθητές που συμμετέχουν σε εξετάσεις μέσω της εφαρμογής Bluebook θα έχουν πλέον πρόσβαση σε ενσωματωμένες λειτουργίες όπως το ChromeVox και η φωνητική πληκτρολόγηση (Dictation). Επιπλέον, ο Chrome στην επιφάνεια εργασίας θα μετατρέπει πλέον σαρωμένα PDF σε αναγνώσιμα αρχεία μέσω OCR, διευκολύνοντας τη χρήση τους από προγράμματα ανάγνωσης οθόνης. Τέλος, η λειτουργία Page Zoom στον Chrome για Android επιτρέπει την αύξηση του μεγέθους κειμένου χωρίς να παραμορφώνεται η διάταξη της σελίδας, με δυνατότητα παραμετροποίησης είτε ανά σελίδα είτε καθολικά.

Οι ανακοινώσεις αυτές εντάσσονται σε ένα ευρύτερο κύμα εξελίξεων στον τομέα της προσβασιμότητας. Η Netflix εισάγει υπότιτλους μόνο για τους διαλόγους, ενώ το Microsoft PowerPoint υποστηρίζει πλέον αρχεία SRT για εύκολη προσθήκη υπότιτλων σε παρουσιάσεις. Την ίδια στιγμή, η Apple ανακοίνωσε νέες δυνατότητες προσβασιμότητας για τις επερχόμενες εκδόσεις των iOS και macOS.

[via]

Loading