iStock

ΠΟΙΕΣ ΛΥΣΕΙΣ ΦΕΡΝΕΙ Η ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ ΣΤΑ ΑΤΟΜΑ ΜΕ ΠΡΟΒΛΗΜΑΤΑ ΑΚΟΗΣ

Με αφορμή τη σημερινή Παγκόσμια Ημέρα Ακοής, o μεταδιδακτορικός ερευνητής στον χώρο της πληροφορικής και της τεχνητής νοημοσύνης, Δημήτρης Κουρεμένος, γράφει για την εμπειρία της ζωής χωρίς ακοή, τις δυνατότητες και τα όρια της τεχνολογίας και την ανάγκη η προσβασιμότητα να αντιμετωπίζεται ως δικαίωμα.

Ακοή, μια λέξη, μια έννοια, μια αίσθηση που, για όσους την έχουν, μοιάζει αυτονόητη. Για εκείνους που δεν την έχουν, η σημασία της αναδεικνύεται κάθε στιγμή, μέσα σε έναν κόσμο τόσο πλούσιο σε ηχητικά ερεθίσματα. Πάντα ήλπιζα να είχα, έστω για λίγο, την εμπειρία και το βίωμα της ακοής και ας την έχανα μετά. Έστω για ένα λεπτό, να ήξερα τι είναι αυτή η ακοή, τι είναι αυτό που συγκινεί τόσο τους ανθρώπους όταν ακούν μια μελωδία. Όπως και να μπορούσα να ακούσω τη φωνή, το γέλιο των αγαπημένων μου ανθρώπων.

Τα στατιστικά στοιχεία δείχνουν ότι η ακοή δεν είναι δεδομένη. Σύμφωνα με τον Π.Ο.Υ.:

  • Πάνω από 1,5 δισ. άνθρωποι ζουν σήμερα με κάποια μορφή απώλειας ακοής (σχεδόν το 20% του παγκόσμιου πληθυσμού).
  • Περίπου 430 εκατ. έχουν σημαντική απώλεια ακοής που χρειάζεται αποκατάσταση.
  • Μέχρι το 2050 ο αριθμός αυτός αναμένεται να ξεπεράσει τα 700 εκατομμύρια.

Και γελάω, ή μάλλον γελάω και μελαγχολώ μαζί, όταν θυμάμαι ότι στο σχολείο ένιωθα πως ήμουν ο μοναδικός στον κόσμο με πρόβλημα ακοής. Αλήθεια, τόσοι πολλοί και ταυτόχρονα τόσο λίγοι. Τόσο αόρατοι.

Ταυτόχρονα, θυμώνω γιατί διαβάζω ότι αρκετοί άνθρωποι χάνουν την ακοή τους από αίτια που θα μπορούσαν να είχαν προβλεφθεί και να είχαν αποφευχθεί. Στα παιδιά, αναφέρει ο Π.Ο.Υ., ισχύει για πάνω από το 60% των περιπτώσεων. Είναι φοβερό. Ενημερωθείτε. Μάθετε. Αποφύγετε εκθέσεις σε κινδύνους που οδηγούν σε απώλεια ακοής. Είναι κρίμα να χάνεται ένα δώρο.

Τι λύσεις φέρνει η τεχνητή νοημοσύνη στα άτομα με προβλήματα ακοής
O πραγματικά προσβάσιμος αυτόματος υποτιτλισμός για κωφούς και βαρήκοους (SDH) δεν δείχνει μόνο τα λόγια αλλά και βασικούς ήχους, μουσική και ποιος μιλάει. Unsplash Detail .co

Οι λύσεις της τεχνητής νοημοσύνης για προβλήματα ακοής

Η τεχνολογία και η τεχνητή νοημοσύνη (ΤΝ) έρχονται να λύσουν αρκετά προβλήματα. Τα ακουστικά βαρηκοΐας, συνδυαστικά με ΤΝ, προσφέρουν πρωτόγνωρες δυνατότητες, αδιανόητες πριν από μία δεκαετία. Το ίδιο και οι συσκευές και τα έξυπνα κινητά με λογισμικό αναγνώρισης φωνής και αυτόματης μετάφρασης, που ήδη βοηθούν σε μεγάλο βαθμό. Έχουμε ακόμα δρόμο, ωστόσο είναι θέμα χρόνου να γίνουν ακόμη καλύτερα.

Ήδη τα κινητά υποστηρίζουν λύσεις όπως το Live Transcribe και, μιλώντας για transcribes (μεταγραφές), ας αναφερθούμε και στους υπότιτλους. Δεν είναι όλοι οι υπότιτλοι το ίδιο· άλλο ο απλός αυτόματος υποτιτλισμός και άλλο ο πραγματικά προσβάσιμος για κωφούς και βαρήκοους (SDH), που δεν δείχνει μόνο τα λόγια αλλά και βασικούς ήχους, μουσική και ποιος μιλάει. Αυτές οι λεπτομέρειες κάνουν τεράστια διαφορά στην πραγματική πρόσβαση και είναι θέματα που η ακαδημαϊκή κοινότητα παλεύει να λύσει, έχοντας κάνει καταπληκτική δουλειά.

Η τεχνολογία της αναγνώρισης φωνής, παρόλο που σε ιδανικές συνθήκες λειτουργεί άψογα, δεν μπορεί πάντα να αντεπεξέλθει σε πραγματικές, δηλαδή σε ζωντανό χρόνο και σε περιβάλλον με θόρυβο. Όμως σημειώνεται και εκεί σοβαρή πρόοδος. Τα τελευταία χρόνια, τα συστήματα που συνδυάζουν αναγνώριση ομιλίας και αυτόματο υποτιτλισμό (ζωντανός υποτιτλισμός) δεν περιορίζονται στο να μετατρέπουν τον ήχο σε κείμενο. Η φωνή ενσωματώνεται σε ευρύτερα μοντέλα τεχνητής νοημοσύνης, που επεξεργάζονται ταυτόχρονα κείμενο, εικόνα και ήχο, μπορούν να αναγνωρίζουν ποιος μιλάει κάθε στιγμή και να εντοπίζουν βασικούς περιβαλλοντικούς ήχους.

Τι λύσεις φέρνει η τεχνητή νοημοσύνη στα άτομα με προβλήματα ακοής
Η τεχνητή νοημοσύνη δεν έχει καταφέρει ακόμη τα αντίστοιχα άλματα που έχουν γίνει στην ομιλία, κυρίως για λόγους ποσοτικούς: λίγα δεδομένα, έλλειψη γραπτής μορφής και γενικά περιορισμένοι πόροι. iStock
Η τεχνητή νοημοσύνη δεν έχει καταφέρει ακόμη τα αντίστοιχα άλματα που έχουν γίνει στην ομιλία, κυρίως για λόγους ποσοτικούς: λίγα δεδομένα, έλλειψη γραπτής μορφής και γενικά περιορισμένοι πόροι.

Στα αγγλικά, η ακρίβεια του ζωντανού υποτιτλισμού σε ρεαλιστικές συνθήκες προσεγγίζει πλέον το 90-93%, ενώ στα ελληνικά τα ποσοστά παραμένουν χαμηλότερα και εξαρτώνται έντονα από την ποιότητα ήχου, το θεματικό πεδίο και τον βαθμό τεχνικού λεξιλογίου. Εμπειρικά, ερευνητές που εργάζονται με ελληνικό corpus εκτιμούν ακρίβεια της τάξης του 75-85%.

Πού σκοντάφτει η εφαρμογή τεχνητής νοημοσύνης στη νοηματική γλώσσα

Στη νοηματική γλώσσα η πρόοδος είναι πιο αργή. Η τεχνητή νοημοσύνη δεν έχει καταφέρει ακόμη τα αντίστοιχα άλματα που έχουν γίνει στην ομιλία και οι λόγοι είναι κυρίως ποσοτικοί: λίγοι χρήστες, λίγα δεδομένα –απαιτούνται χιλιάδες ώρες βίντεο με λεπτομερή επισήμανση–, έλλειψη γραπτής μορφής και γενικά περιορισμένοι πόροι.

Και είναι λογικό να δυσκολεύει περισσότερο, γιατί η νοηματική είναι μια οπτικο-κινησιακή γλώσσα: χρειάζεται πιο απαιτητικά δεδομένα (βίντεο, χρονική ευθυγράμμιση, σωστή επισημείωση), άρα και πολύ περισσότερη δουλειά για να εκπαιδευτούν σωστά τα συστήματα. Και επειδή η ΤΝ θέλει τεράστια δεδομένα, η νοηματική έχει μείνει πιο πίσω στις εξελίξεις.

Παρ' όλα αυτά, αναπτύσσονται μοντέλα διεθνώς που επιχειρούν να αναγνωρίζουν νοηματική απευθείας από εικόνα, ενώ και στην Ελλάδα έχουν δημιουργηθεί οργανωμένα ερευνητικά σύνολα δεδομένων για την Ελληνική Νοηματική Γλώσσα, η οποία έχει αναγνωριστεί επίσημα από το κράτος. Το χάσμα με τις μεγάλες γλώσσες παραμένει, αλλά δεν είμαστε στο μηδέν.

Η ΠΡΟΣΒΑΣΙΜΟΤΗΤΑ ΕΙΝΑΙ ΔΙΚΑΙΩΜΑ, ΕΝΑ ΟΛΟΚΛΗΡΟ ΠΛΑΙΣΙΟ ΠΟΥ ΠΕΡΙΛΑΜΒΑΝΕΙ ΚΑΙ ΤΟΝ ΑΝΘΡΩΠΟ· ΤΗ ΣΥΜΠΕΡΙΦΟΡΑ, ΤΗΝ ΨΥΧΟΛΟΓΙΑ, ΤΗΝ ΚΟΥΛΤΟΥΡΑ, ΤΗΝ ΕΝΣΥΝΑΙΣΘΗΣΗ.

Η προσβασιμότητα είναι δικαίωμα

Αν η κοινωνία και η πολιτεία έβλεπαν πιο σοβαρά την προσβασιμότητα και έδιναν τη σωστή προτεραιότητα και πόρους, θα είχαμε παγκοσμίως καλύτερα αποτελέσματα σε όλους τους τομείς. Η αγορά και οι επιχειρήσεις, δυστυχώς, λειτουργούν συχνά με όρους κέρδους και όχι προσβασιμότητας. Μόνο με κατάλληλο, αυστηρό πλαίσιο θα μπορέσουμε, αν όχι να εξαλείψουμε, τουλάχιστον να μειώσουμε αρκετά τα εμπόδια που δημιουργεί η έλλειψη ακοής.

Η προσβασιμότητα πρέπει να αντιμετωπίζεται ως δικαίωμα και όχι σαν ευκολία μιας συσκευής είτε υπηρεσίας, ή σαν feature ενός καινοτόμου gadget. Είναι ένα ολόκληρο πλαίσιο που περιλαμβάνει και τον άνθρωπο· τη συμπεριφορά, την ψυχολογία, την κουλτούρα, την ενσυναίσθηση.

ΙΣΩΣ ΜΙΑ ΜΕΡΑ Η ΣΙΩΠΗ ΝΑ ΜΗΝ ΕΙΝΑΙ ΕΜΠΟΔΙΟ, ΑΛΛΑ ΑΠΛΩΣ ΕΝΑΣ ΔΙΑΦΟΡΕΤΙΚΟΣ ΤΡΟΠΟΣ ΝΑ ΥΠΑΡΧΕΙΣ ΣΤΟΝ ΚΟΣΜΟ.

Τι να πεις για τα άτομα που νευματίζουν, που κινούν τα χέρια γρήγορα και κάνουν τις λέξεις να χορεύουν στον αέρα. Μια εικόνα όμορφη, μια κίνηση τόσο δυνατή. Πολλές φορές, ένα νεύμα μπορεί να είναι πιο δυνατό και πιο εκφραστικό από έναν ήχο. Πολλές φορές, η σιωπή είναι πιο δυνατή και πιο ηχηρή. Δεν θα έπρεπε η κοινότητα αυτή να βιώνει τόσο έντονα τον αποκλεισμό και τα εμπόδια.

Ευτυχώς, κάποιοι ρομαντικοί ερευνητές, σαν σύγχρονοι Κολόμβοι, επιμένουν και παλεύουν με πενιχρά μέσα και λίγους πόρους, να βελτιώσουν και να αναπτύξουν έστω κάποια ψήγματα λύσεων ή έστω να δώσουν ένα ελπιδοφόρο μήνυμα για το μέλλον: ότι ναι, η νοηματική μπορεί να ενταχθεί και μπορεί να υποστηριχθεί από την τεχνητή νοημοσύνη. Πραγματικά το εύχομαι, γιατί είμαι κι εγώ ένας από αυτούς και έχω ζήσει από πρώτο χέρι τα προβλήματα.

Ευελπιστώ ότι μια μέρα οι κωφοί και βαρήκοοι άνθρωποι θα έχουν πλήρη και ανεμπόδιστη πρόσβαση σε όλους τους τομείς της κοινωνίας, χωρίς όρια. Είναι ευχή μου και μεγάλη μου επιθυμία, και ελπίζω να βάλω έστω ένα λιθαράκι προς αυτή την κατεύθυνση.

Είμαι αισιόδοξος. Έχουν γίνει μεγάλα βήματα και η κοινωνία έχει αρχίσει να αποδέχεται το διαφορετικό. Το στίγμα, σιγά σιγά, φεύγει. Ίσως μια μέρα η σιωπή να μην είναι εμπόδιο, αλλά απλώς ένας διαφορετικός τρόπος να υπάρχεις στον κόσμο.

Ο Δημήτρης Κουρεμένος, PhD, είναι ερευνητής στον χώρο της πληροφορικής και της τεχνητής νοημοσύνης με εξειδίκευση στην προσβασιμότητα για Κωφούς και Βαρήκοους. Εργάζεται στο Ινστιτούτο Πληροφορικής και Τηλεπικοινωνιών του Εθνικού Κέντρου Έρευνας Φυσικών Επιστημών (ΕΚΕΦΕ) «Δημόκριτος», στο Computational Intelligence Lab, και δραστηριοποιείται ερευνητικά στον τομέα της πολυτροπικής ανάλυσης και της προσβάσιμης ΤΝ.

SLOW MONDAY NEWSLETTER

Θέλεις να αλλάξεις τη ζωή σου; Μπες στη λογική του NOW. SLOW. FLOW.
Κάθε Δευτέρα θα βρίσκεις στο inbox σου ό,τι αξίζει να ανακαλύψεις.