Ενεργοποίηση του φίλτρου πορνογραφίας μέσω αναγνώρισης ήχου!

Δε χρειάζεται και πολλή φαντασία για να μαντέψει κανείς πώς ακούγεται ένα βίντεο ερωτικού περιεχομένου. Το εντυπωσιακό στην όλη υπόθεση είναι όταν το κάνει ο υπολογιστής!

Μέχρι στιγμής, υπήρχαν αυτόματα συστήματα ανάλυσης της εικόνας που χρησιμοποιούνταν για να ανιχνεύουν "ανεπιθύμητο" υλικό προτού αυτό φτάσει στην οθόνη του υπολογιστή, διακρίνοντας μεγάλες περιοχές της εικόνας σε χρώμα του δέρματος.

Ωστόσο, κάτι τέτοιο δε σήμαινε απαραίτητα ότι επρόκειτο για πορνογραφικό υλικό, αφού θα μπορούσε να είναι κάτι  "αθώο" (π.χ. ένας άνθρωπος με μαγιό ή ένα πρόσωπο σε κοντινό.) Έτσι, σύμφωνα με τους MyungJong Kim και Hoirin Kim, ηλεκτρολόγους μηχανικούς του Advanced Institute of Science and Technology της Νότιας Κορέας, "η ανάλυση του ήχου θα μπορούσε να λύσει τα προβλήματα αυτά".

Οι τελευταίοι χρησιμοποίησαν μια τεχνική επεξεργασίας σημάτων, που ονομάζεται Radon Transform προκειμένου να δημιουργήσουν φασματογραφήματα από μία μεγάλη ποικιλία audio clips, διάρκειας ακριβώς μισού δευτερολέπτου το καθένα.

Αυτό που ανακάλυψαν ήταν ότι τα ηχητικά σήματα της ομιλίας ήταν συνήθως χαμηλού τόνου, ενώ τα ηχητικά σήματα της μουσικής είχαν ποικίλλους τόνους. Από την άλλη πλευρά, οι "ερωτικοί" ήχοι ήταν υψηλού τόνου, είχαν συχνές εναλλαγές και επαναλαμβάνονταν περιοδικά.

Με βάση τα χαρακτηριστικά αυτά, οι ερευνητές χρησιμοποίησαν ένα στατιστικό μοντέλο για να κατατάξουν τους ήχους σε ερωτικούς ή μη, χρησιμοποιώντας ήχους από online videos.

Sex Moan

Τα μη ερωτικά videos περιλάμβαναν μουσική, ταινίες, ειδήσεις ή αθλητικά. Το αποτέλεσμα ήταν το μοντέλο να διακρίνει σωστά το 93% του πορνογραφικού υλικού! Τα clips στα οποία έκανε λάθος είτε είχαν μουσική στο background και μπέρδευαν το μοντέλο είτε ήταν κωμικού περιεχομένου και περιείχαν γέλια και φωνές από το κοινό, ήχους δηλαδή με παρόμοια χαρακτηριστικά με τους σεξουαλικούς ήχους.

Σύμφωνα με τον Richard Harvey του Πανεπιστημίου East Anglia του Norwich, που εργαζόταν παλιότερα πάνω στην ανίχνευση πορνογραφικού υλικού βάσει της εικόνας, οι μέθοδοι που βασίζονται στην εικόνα είναι εξίσου ακριβείς και απαιτούν συνήθως μία μόνο εικόνα σε αντίθεση με τις μεθόδους του ήχου που χρειάζονται clips μεγαλύτερης διάρκειας. Έτσι, προτείνει πως η καλύτερη λύση είναι ο συνδυασμός των δύο αυτών μεθόδων.

[πηγή NewScientist]
Loading