Φανταστείτε να βρίσκεστε σε ένα πολυσύχναστο εστιατόριο ή σε έναν θορυβώδη δρόμο. Η οχλοβοή είναι τόσο έντονη που δυσκολεύεστε να ακούσετε ακόμη και τον άνθρωπο που στέκεται ακριβώς δίπλα σας. Τώρα, φανταστείτε πως με το που ξεκινάτε να μιλάτε, ο υπόλοιπος κόσμος «χαμηλώνει» την έντασή του και οι φωνές της παρέας σας φτάνουν στα αυτιά σας κρυστάλλινες, απομονωμένες από το χάος. Αυτό ακριβώς υπόσχεται η νέα τεχνολογία που αναπτύχθηκε από ερευνητές του Πανεπιστημίου της Ουάσιγκτον.
Η ομάδα, η οποία είχε ήδη παρουσιάσει στο παρελθόν δείγματα γραφής στον τομέα της «σημασιολογικής ακοής», επιστρέφει με ένα ακόμα πιο εξελιγμένο σύστημα: τα «προληπτικά ακουστικά βοηθήματα». Πρόκειται για ακουστικά τεχνητής νοημοσύνης που έχουν την ικανότητα να αντιλαμβάνονται αυτόματα με ποιους συνομιλείτε και να απομονώνουν τις φωνές τους σε πραγματικό χρόνο, εξαλείφοντας σχεδόν οτιδήποτε άλλο.
Πώς λειτουργεί η «Αόρατη» ασπίδα θορύβου
Η ειδοποιός διαφορά σε σχέση με προγενέστερες προσπάθειες είναι η αυτοματοποίηση. Ενώ παλαιότερα συστήματα απαιτούσαν από τον χρήστη να κοιτάξει επίμονα τον συνομιλητή του ή να πατήσει κάποιο κουμπί για να «κλειδώσει» την πηγή του ήχου, το νέο αυτό σύστημα είναι σχεδιασμένο να λειτουργεί αθόρυβα στο παρασκήνιο.
Ο μηχανισμός ενεργοποιείται μόλις ο χρήστης αρχίσει να μιλάει. Χρησιμοποιώντας μικρόφωνα ενσωματωμένα στα ακουστικά, το σύστημα καταγράφει τη φωνή του χρήστη και αναλύει τον ρυθμό της συνομιλίας. Ένα εξειδικευμένο μοντέλο τεχνητής νοημοσύνης αναλαμβάνει δράση, παρακολουθώντας ποιος μιλάει και πότε. Μόλις εντοπίσει τις φωνές που ανταποκρίνονται στη συζήτηση, ένα δεύτερο μοντέλο αναλαμβάνει να τις διαχωρίσει από το περιβάλλον. Το αποτέλεσμα; Ο χρήστης ακούει καθαρά τους συνομιλητές του, ενώ οι υπόλοιποι ήχοι – από το θρόισμα του δρόμου μέχρι τις ομιλίες τρίτων – μπαίνουν σε σίγαση.
Δυνατότητα για πολλαπλούς συνομιλητές
Ένα από τα πιο εντυπωσιακά χαρακτηριστικά του πρωτοτύπου είναι η ικανότητά του να διαχειρίζεται ταυτόχρονα πολλούς ομιλητές. Σύμφωνα με τους ερευνητές, το σύστημα μπορεί να παρακολουθεί και να απομονώνει έως και τέσσερις διαφορετικούς συνομιλητές ταυτόχρονα. Αυτό το καθιστά ιδανικό για ομαδικές συζητήσεις σε κοινωνικές εκδηλώσεις, όπου η προσοχή μας συχνά εναλλάσσεται μεταξύ διαφορετικών προσώπων.
Η τεχνολογία είναι σχεδιασμένη ώστε να μην υπάρχει αισθητή καθυστέρηση (lag) στον ήχο, κάτι που θα καθιστούσε την επικοινωνία αφύσικη. Αν και προς το παρόν απαιτείται η σύνδεση των ακουστικών με έναν μικρό φορητό υπολογιστή για την επεξεργασία των δεδομένων, η ομάδα εργάζεται ήδη για τη σμίκρυνση του hardware ώστε να ενσωματωθεί πλήρως σε μελλοντικές συσκευές.
Ελπίδα για άτομα με προβλήματα ακοής
Πέρα από την άνεση που προσφέρει στον μέσο χρήστη, η συγκεκριμένη τεχνολογία φέρνει αισιόδοξα νέα για άτομα με προβλήματα ακοής. Τα σημερινά ακουστικά βαρηκοΐας, αν και ενισχύουν τον ήχο, συχνά δυσκολεύονται να διακρίνουν την «χρήσιμη» ομιλία από τον γενικό θόρυβο, κουράζοντας τον χρήστη. Η προσέγγιση του Πανεπιστημίου της Ουάσιγκτον προσφέρει μια λύση στο λεγόμενο «πρόβλημα του πάρτι», επιτρέποντας στον εγκέφαλο να ξεκουραστεί από την προσπάθεια φιλτραρίσματος.
Στις δοκιμές που πραγματοποιήθηκαν με 11 εθελοντές, τα αποτελέσματα ήταν ενθαρρυντικά. Οι συμμετέχοντες αξιολόγησαν την ποιότητα του ήχου με την ενεργοποιημένη AI ως υπερδιπλάσιας καθαρότητας σε σχέση με τον φυσικό ήχο.
Το μέλλον είναι Open Source
Αξίζει να σημειωθεί πως οι ερευνητές δεν κρατούν αυτή την τεχνολογία κλειδωμένη πίσω από πατέντες. Ο κώδικας για την εκπαίδευση των μοντέλων και την αναπαραγωγή του συστήματος είναι διαθέσιμος ανοιχτά, επιτρέποντας στην παγκόσμια κοινότητα προγραμματιστών και μηχανικών να πειραματιστεί και να βελτιώσει περαιτέρω τη μέθοδο.
Αν και δεν θα δούμε αυτά τα ακουστικά στα ράφια των καταστημάτων αύριο το πρωί, η κατεύθυνση είναι σαφής. Η επόμενη γενιά των "wearables" δεν θα αρκείται απλώς στο να παίζει μουσική ή να ακυρώνει τον θόρυβο του κινητήρα ενός αεροπλάνου. Θα είναι ενεργοί βοηθοί στην καθημερινότητά μας, ικανοί να καταλαβαίνουν το πλαίσιο στο οποίο βρισκόμαστε και να προσαρμόζουν την πραγματικότητά μας αναλόγως.