Carrefour des Nouvelles Technologies et des Réseaux Sociaux

Prochain carrefour

Vendredi 30 Mars   de 9h à 12h

Thème :

Applications Google

Téléphonie

 

Dernier carrefour

Vendredi 23 Février 2018  de 9h à 10h30

Compte rendu du dernier carrefour

Synthèses vocales

Carrefours précédents

Compte rendu des carrefours précédents

Activer le lien rapports carrefours du menu de gauche.

 


 

Compte rendu du CNTRS du 23/02/18.

Synthèses vocales

 

Ce CNTRS dont le thème était de décrypter les indications des synthèses vocales pour pouvoir gérer au mieux ses applications avait attiré une très forte chambrée, puisque presque une vingtaine de personnes étaient présentes autour de la table de l’Atrium.

Après notre tour de table de présentation habituel, nous entrons le sujet avec un bref historique de l’évolution des synthèses vocales. C’est en 1791 que le Baron Von Kempelen eu l’idée de créer une machine reproduisant des sons. Cette machine était constituée d’étages d’instruments reproduisant les différents organes humains concernés. L’auditoire écoute une démonstration de cette machine où on perçoit quelques voyelles.

Une seconde génération de synthèses vocale verra le jour entre 1965 et 1985 dans la reproduction du spectre sonore, c'est-à-dire la fréquence de chaque son. Les sons reproduits donnaient une élocution saccadée, rendue célèbre par les voix de robots entendues dans la filmographie de l’époque.

La grande évolution des synthèses se fera grâce à l’augmentation de la capacité de mémoire des systèmes informatiques, car on va enregistrer pour chaque langue des diphonies, (pour schématiser des syllabes), ainsi une phrase à énoncer est convertie phonétiquement avant d’assembler les différents diphones nécessaires. Nous écoutons les créations de la société Voxygene, spécialiste en la matière, qui arrive à recréer des voix personnalisées. Les voix seront d’autant proches de la réalité, qu’elles maitriseront les 3 composantes intonations, rythme et emphase.

François nous montre une clé USB, fonctionnant avec la reconnaissance vocale.

Nous proposons ensuite un exercice d’écoute et de concentration sur les indications de la synthèse en préambule à notre déchiffrage des éléments sonore. Il s’agit d’écouter les indications sonores de la synthèse vocale pour les procédures les plus utilisées et de choisir parmi deux propositions d’actions celle qui convient le mieux.

Cet exercice a permis de découvrir les différents éléments que nous pouvons aborder lors de notre navigation sur Windows, nous y reviendrons plus en détails par la suite.

Nous précisons que les indications de la synthèse doivent être paramétrées en qualité (choix du synthétiseur, de la voix, du volume et du débit) mais aussi en quantité (en mode écriture : écho clavier par caractère ou par mot, en lecture le rythme ligne ou phrase quelques ponctuations ou plus, choisir une verbosité adaptée à son niveau (c'est-à-dire avoir besoin de plus ou moins d’informations). La perception auditive est fugitive, contrairement au visuel, il nous faut comprendre rapidement le contexte où l’on se trouve pour réagir en conséquence. C’est pourquoi le paramétrage de la synthèse doit être fait avec soin.

Pour être performant, il faut connaître également les différents éléments du système d’exploitation.

Travaillant sur Windows, nous passons en revue les différents objets : la simple notification, le message d’alerte avec bouton de validation, les boites de dialogues simples avec les boutons OUI, NON, ANNULER, les boites de dialogues plus complexes avec zone d’édition, listes déroulantes, cases à cocher, boutons radios, les mêmes boites de dialogues comportant plusieurs onglets, les fenêtres d’application avec les différentes barres et menus ; les fenêtres Windows plus spécifiques (bureau, interface métro, explorateur , panneau de configuration). Il s’agit pour chacun de ceux de bien connaître ses spécificités et de son cadre d’utilisation pour adapter sa navigation. Jaws possède en effet plusieurs curseurs et NVDA plusieurs modes de navigation (focus, document ou objet), il convient de choisir celui qui sera le plus approprié.

Cette partie, somme toute très théorique demandait un débouché pratique, c’est pourquoi un autre CNTRS a été programmé où les participants, grâce aux seules indications de la synthèse vocale devront corriger un texte, l’enregistrer, créer un répertoire et déplacer ce document dans ce dernier.