Logo Google

Le chercheur sourd de Google, Dimitri Kanevsky, était à Paris pour une démonstration d’Euphonia, un projet de transcription de la parole pour les personnes présentant des troubles de l’élocution.

La plupart des gens tiennent pour acquis que, lorsqu’ils parleront, ils seront entendus et compris. Mais pour les millions de personnes qui souffrent de troubles de la parole causés par des problèmes physiques ou neurologiques, il peut être difficile d’essayer de communiquer avec d’autres personnes et de les frustrer. 

Bien que les technologies de reconnaissance automatique de la parole (ASR, ou parole à texte) aient récemment fait l’objet de nombreux progrès , ces interfaces peuvent être inaccessibles pour les personnes souffrant de troubles de la parole. En outre, les applications qui utilisent la reconnaissance vocale comme entrée pour la synthèse texte-parole(TTS) peut présenter des erreurs de substitution, suppression et insertion de mots.

 Dans l’environnement technologique actuel, l’accès limité aux interfaces de la parole, telles que les assistants numériques qui dépendent de la compréhension directe de la parole, signifie exclure des outils et des expériences de pointe, creusant ainsi le fossé qui sépare ceux avec et sans parole. les déficiences peuvent accéder

Dimitri Kanevsky a le verbe difficile à comprendre. Sourd depuis qu’il a 1 an, ce chercheur officiant chez Google a une élocution instable, hachée, il passe des aigus aux graves en un rien de temps, comme chez de nombreux sourds profonds.

Le HuffPost l’a rencontré lors de sa démonstration du projet Euphonia. Il est venu à Paris, accompagné de trois ingénieurs Google. 

Ensemble, ils ont présenté un traducteur vocal, qui retranscrit les mots de Dimitri sur un écran dans un anglais tout à fait correct.

Le projet Euphonia a démontré que les modèles de reconnaissance de la parole peuvent être considérablement améliorés pour mieux transcrire une variété de paroles atypiques et dysarthriques.

À la recherche de volontaires pour Euphonia

“J’ai enregistré plus de vingt heures de phrases sur plusieurs mois pour rendre cette intelligence artificielle fonctionnelle, peut-on lire sur l’écran lorsque Dimitri Kanevsky nous parle. Maintenant, il faut que d’autres personnes avec d’autres troubles de l’élocution se lancent dans le projet. Nous recherchons des gens souffrant de la maladie de Charcot, ou victimes d’un AVC…”.

Les troubles de l’élocution se retrouvent sous plusieurs formes. Il y a l’aphasie, la dysphonie, l’anarthrie et la dyslalie. Quels qu’ils soient, Dimitri est preneur pour faire avancer le projet et l’adapter au plus grand nombre.

Le plus grand nombre, c’est bien de cela que l’on parle chez Google. L’ingénieur Brian Kelmer parle d’un milliard de personnes dans le monde souffrant d’un handicap déclaré. Il se base sur les chiffres de l’OMS parus en 2015.

Un milliard de personnes handicapées

Un milliard de clients potentiels, ça laisse rêveur. Google l’a compris, c’est le marché à investir. La firme veut donner des codes de lecture sur Internet aux sourds, aux aveugles, et aux autres personnes handicapées, à la manière des magnats de la presse américaine des années 1910 qui ont réussi à faire acheter leurs journaux à des immigrants illettrés, grâce à l’insertion de strips de bande dessinée sans texte.

Pour arriver à cela, Google met le paquet. L’entreprise présente ces derniers jours six nouveautés, dont cinq viennent d’entrer sur le marché. Mais elle ne dit pas combien elle investit, ni combien de personnes travaillent sur ces projets. On n’aura pas même droit à un pourcentage pour savoir à quelle hauteur l’enjeu est considéré.

“Nous sommes nombreux à travailler sur ce secteur”

Brian Kelmer insiste: “Nous sommes nombreux, des ingénieurs qualité, software, chefs de projet, juristes, à travailler sur ce secteur. L’accessibilité est un véritable enjeu chez Google.”

Le fait est que les nouveautés de cet ordre pleuvent depuis quelques mois. On se souvient de Voice Access qui remplace les interactions tactiles par des commandes vocales.

Conclusion

Cela permet aux utilisateurs ayant un discours atypique de parler et d’être compris par d’autres personnes et par les interfaces vocales, avec son approche de conversion vocale de bout en bout plus susceptible de reproduire le discours souhaité par l’utilisateur. 

Nous avons hâte que toutes ces recherches soient mises rapidement sur le marché, afin d’en profiter et cela aidera un grand nombre de personnes dont moi le premier.

Sources : Huffingtonpost et aiGoogleblog

Google mise gros pour être accessible aux sourds et personnes ayant des troubles d’élocution

Vous pourrez aussi aimer

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *