Η τεχνολογία συνεχίζει να μεταμορφώνει τον τρόπο που επικοινωνούμε, και ένα πρόσφατο καινοτόμο προϊόν, τα TranscribeGlass, έρχεται να αποδείξει ότι οι έξυπνοι αισθητήρες και η τεχνητή νοημοσύνη μπορούν να βελτιώσουν την καθημερινότητα των ανθρώπων με ακουστικές δυσκολίες. Πρόκειται για ένα ζευγάρι έξυπνων γυαλιών που εμφανίζουν υπότιτλους σε πραγματικό χρόνο στις συνομιλίες, προβάλλοντας τα λόγια που ακούγονται μπροστά στα μάτια του χρήστη. Το όραμα του δημιουργού τους, Madhav Lavakare, είναι να βοηθήσουν κυρίως άτομα με βαρηκοΐα ή κώφωση να συμμετέχουν ενεργά σε συζητήσεις και να μην αποκλείονται από τον κόσμο γύρω τους.
Τα TranscribeGlass ξεχωρίζουν αρχικά για το πολύ ελαφρύ τους βάρος — μόλις 36 γραμμάρια — κάτι που οφείλεται στο γεγονός ότι το μεγαλύτερο μέρος της επεξεργασίας γίνεται μέσα από μια εφαρμογή σε iOS συσκευές, ενώ τα ίδια τα γυαλιά περιλαμβάνουν μόνο έναν μικρό προβολέα στο πλαίσιο ενός ματιού, που προβάλλει υποτίτλους σε ανάλυση 640x480 pixel πάνω στην επιφάνεια των φακών. Δεν υπάρχουν ενσωματωμένα μικρόφωνα, κάμερες ή ηχεία στα γυαλιά, γεγονός που τα κάνει πιο ελαφριά και λιγότερο ογκώδη σε σχέση με άλλες συσκευές «έξυπνων» γυαλιών.
Η εφαρμογή επιτρέπει στον χρήστη να προσαρμόσει τη θέση των υποτίτλων εντός ενός πεδίου όρασης 30 μοιρών, ενώ μπορεί να επιλέξει αν θα εμφανίζονται πολλές γραμμές ταυτόχρονα ή ακόμα και μόνο μια λέξη τη φορά, ανάλογα με τις προτιμήσεις και την άνεση στην ανάγνωση. Η μπαταρία των γυαλιών κρατά περίπου οκτώ ώρες, καλύπτοντας μια ολόκληρη ημέρα χρήσης, ενώ το κόστος αγοράς αγγίζει τα 377 δολάρια, με επιπλέον μηνιαία συνδρομή 20 δολαρίων για την υπηρεσία μεταγραφής.
Πέρα από την εμφάνιση των υποτίτλων, ο ιδρυτής Madhav Lavakare έχει ήδη στο πλάνο του επιπλέον λειτουργίες, όπως η αυτόματη μετάφραση ομιλίας σε πραγματικό χρόνο και η ανάλυση της συναισθηματικής κατάστασης του συνομιλητή, ώστε ο χρήστης να ενημερώνεται αν η συζήτηση περιλαμβάνει αμήχανες ή άλλες κοινωνικές εντάσεις.
Η ιδέα για τα TranscribeGlass γεννήθηκε από την επιθυμία του Lavakare, φοιτητή στο Yale, να βοηθήσει έναν φίλο του με βαρηκοΐα που δυσκολευόταν να παρακολουθήσει συζητήσεις που δεν λάμβαναν υπόψη τις ανάγκες του. Εμπνευσμένος από τα Google Glass, ήθελε να δημιουργήσει κάτι πιο λειτουργικό και καλαίσθητο. Αν και τα γυαλιά διατηρούν κάποια κοινά χαρακτηριστικά με τα Google Glass, όπως η διακριτική προβολή στο φακό, παρουσιάζουν σαφώς πιο φυσική εμφάνιση και είναι λιγότερο ενοχλητικά για τον χρήστη και τους γύρω του.

Κατά τη διάρκεια μιας δοκιμής σε έναν πολυσύχναστο χώρο συνεργασίας στο Σαν Φρανσίσκο, η εφαρμογή απέδωσε με ακρίβεια τα λόγια των συνομιλητών, ακόμα και σε περιβάλλον με πολλές ταυτόχρονες συζητήσεις. Οι υποτίτλοι εμφανίζονταν με σαφήνεια και οι ομιλητές διαχωρίζονταν με ετικέτες, ώστε να μη δημιουργείται σύγχυση. Η ταχύτητα απόδοσης των υποτίτλων ήταν τόσο μεγάλη, που ο χρήστης μπορεί να δυσκολευτεί να διαβάσει όλα τα λόγια σε πραγματικό χρόνο, όμως με λίγη εξοικείωση αυτό γίνεται πιο εύκολο. Μολονότι η μεταγραφή δεν είναι πάντα τέλεια και ορισμένες φορές δυσκολεύει την ανάγνωση, η συνολική εμπειρία δείχνει την αξία του εργαλείου για την κοινότητα των βαρήκοων.
Παρόλο που στην αγορά υπάρχουν και άλλες εταιρείες που προσφέρουν έξυπνα γυαλιά με περισσότερες λειτουργίες — όπως πλοήγηση βήμα προς βήμα ή αλληλεπίδραση με chatbot — ο Lavakare υποστηρίζει ότι η εξειδίκευση του TranscribeGlass στη μεταγραφή συνομιλιών είναι το στοιχείο που τα καθιστά πραγματικά χρήσιμα και πολύτιμα για τους χρήστες τους. Η απλότητα και η εστίαση σε μια βασική ανάγκη, την κατανόηση του προφορικού λόγου, είναι το «κλειδί» για να τα φορούν οι άνθρωποι και να τα εντάξουν στην καθημερινότητά τους.
Παράλληλα, ο Lavakare φιλοδοξεί να ενσωματώσει λειτουργίες που θα βοηθούν στην ερμηνεία της επικοινωνίας πέρα από τα λόγια. Μια τέτοια είναι η μετάφραση της ομιλίας σε μορφή που μοιάζει με τη νοηματική γλώσσα, η οποία έχει διαφορετική δομή από την αγγλική γλώσσα και χρήζει ιδιαίτερης προσοχής ώστε να αποφεύγονται λάθη ή παρανοήσεις. Για το λόγο αυτό, η ομάδα έχει συνεργαστεί με εκπαιδευτικούς της American School for the Deaf, ώστε να διασφαλίσει την ποιότητα και ακρίβεια των μεταφράσεων.
Ένα ακόμα πιο πρωτοποριακό πείραμα αφορά την αναγνώριση συναισθημάτων βάσει του τόνου της φωνής. Αν και αυτή η τεχνολογία εγείρει ηθικά και τεχνικά ζητήματα, η ομάδα του TranscribeGlass την δοκιμάζει με στόχο να την κυκλοφορήσει σύντομα. Η ανίχνευση του συναισθηματικού περιεχομένου της ομιλίας μπορεί να ενισχύσει την κατανόηση μιας συζήτησης, αφού συχνά το πώς λέγονται τα λόγια είναι εξίσου σημαντικό με το τι λέγεται.
[via]