UN Special No 638 March-Mars 2005

Services


La reconnaissance vocale

Sergio da Silva, ONU/STIC

La reconnaissance vocale est un ensemble des techniques ayant pour but de permettre à un ordinateur de reconnaître les signaux émis par la voix humaine en vue d’en faire le traitement. Dans la pratique, on installe un programme spécifique dans l’ordinateur et avec un microphone, on dicte les textes qui seront traités par le programme en question.
C’est en l’an 2000 que cette technologie a commencé à être utilisée au Service linguistique de l’ONU à Genève. Nous avons contacté plusieurs utilisateurs pour connaître davantage sur le sujet:

Maggy Wachter, responsable du projet: « Il a tout d’abord fallu commencer par offrir une formation de haut niveau; quelqu’un peut apprendre à jouer du piano, mais avant de donner un concert il y a un bout de chemin à parcourir…
L’ordinateur doit pouvoir vous comprendre mais vous devez aussi savoir comment lui parler. Un utilisateur qui avait eu des difficultés à se faire comprendre par l’ordinateur a trouvé la solution: lui lire des contes de « La Fontaine »: l’approche semble avoir été bonne, puisqu’il a commencé à être mieux compris. Qui a dit que les ordinateurs n’avaient pas d’âme ?
Le programme retenu « Dragon Naturally Speaking », a été initialement développé pour ceux qui avaient des difficultés d’ordre physique, ce qui les empêchait d’utiliser le clavier.
Il nous permet de choisir la langue et quelquefois aussi le pays où elle est parlée, tel que l’anglais utilisé et prononcé en Angleterre, aux Etats-Unis, en Australie, en Inde ou en Asie du Sud est.
Si j’ai une idée dans mon trajet de la maison au travail, je la dicte à mon enregistreur de poche et en arrivant au bureau, je transfère le fichier sur l’ordinateur. Je vois alors, apparaître à l’écran une phrase après l’autre, du texte que j’ai dicté. Je peux ensuite faire des corrections ou faire lire le texte à haute voix par le PC.
Je pense que nous sommes dans une période propice au développement de l’utilisation de ces technologies.

Miguel Gonzalez fournit l’assistance technique aux sections de traduction française, anglaise, espagnole et chinoise (les versions arabes et russes n’étant pas disponibles): « Le vendeur a initialement donné une formation de base sur place et nous l’avons complémentée avec des sessions de formation utilisant le travail réel des utilisateurs.
Ce nouvel interface avec l’ordinateur, demande un certain temps d’adaptation et d’apprentissage. Cela se répercute initialement sur l’indice de productivité de chacun, qui évoluera progressivement en fonction de l’intérêt de l’utilisateur pour les nouvelles technologies et du temps qu’il dispose pour leur pratique.
L’actualisation régulière des versions du produit contribue à l’intérêt des utilisateurs.

Carlos Salmon traduit vers l’Espagnol et utilise la reconnaissance vocale depuis 5 ans. Il lance Word 2000 sur son PC, ouvre son microphone et commence d’abord à lire mentalement les phrases du document original en anglais ou en français et les traduit de vive voix en espagnol.
Le fichier avec le texte et son impression corrigée sont ensuite envoyés au pool.
« C’est un avantage de dicter et de voir le texte devant mes yeux. D’autres collègues utilisent l’enregistreur de cassettes. Au début, nous devons être patients et bien prononcer les mots. Après, il nous est possible de parler avec un rythme normal. Le système apprend au fur et à mesure que nous corrigeons des fautes et la productivité augmente. Si nous avons un rhume, cela peut changer l’interprétation de la voix, il nous faut alors définir un autre profil d’utilisateur. »

Nigel Lindup est dans la section anglaise de traduction. « Le taux d’intérêt des utilisateurs par la reconnaissance vocale, dépend de leur intérêt personnel dans les nouvelles technologies. L’attitude appliquée des utilisateurs dès le départ est capitale pour le succès des projets de ce type.
Il faut garder à l’esprit que la productivité du traducteur ne dépend pas exclusivement d’un outil ni de la
manière comme il est utilisé. L’outil peut cependant aider à raccourcir la chaîne de production. Dans mon cas, je préfère travailler debout (peut-être que je ne veux pas devenir un esclave de l’outil et il faut que je le maîtrise) en lisant le document source en français qui est affiché en haut de l’écran et le document objet avec la traduction anglaise qui s’écrit dans une 2ème fenêtre juste en dessous.
L’utilisation optimale de Dragon est basée sur un bon mélange de l’utilisation de la voix et du clavier pour faire des corrections ».

Eric Duchateau, traducteur français, utilise ce système depuis 2 ans et nous dit que cela a changé sa façon de travailler. Avant, avec le dictaphone, il dictait un texte sans se poser trop de questions, ce qui entraînait un gros travail de lecture après. Maintenant, il produit plutôt un travail fini, paragraphe par paragraphe.
« Si l’analyse de ce qu’on dicte n’est analysée que par des calculs de probabilités et pas par des analyses grammaticales, on peut obtenir un résultat erroné. Je teste une nouvelle version qui indique un meilleur taux de reconnaissance que celle que nous avons et nous serons intéressés par son utilisation, à condition que cela ne pose pas de problèmes de compatibilité avec les logiciels existants dans nos PC.
Patience, productivité, (il faut considérer une baisse pendant l’apprentissage) et changement radical de la façon de travailler (toujours plus difficile pour certains) sont les caractéristiques principales de ce changement. A long terme, on obtient une plus grande productivité si on utilise la reconnaissance vocale
que si on utilise le dictaphone. Ma productivité a augmenté mais cela peut ne pas être le cas pour tout le monde ».

Jiazhi Zhao, traducteur chinois, utilise 60 à 70% de son temps dans un travail de consultation de bases de données terminologiques et de Google pour son travail de traduction.
« J’utilise Dragon chaque jour même si le résultat n’est pas parfait à 100%. Cela vaut quand même la peine de l’utiliser, car cela nous permet de gagner du temps. Environ 25% de mes collègues l’utilisent et la vitesse d’interprétation est bonne. »

Xingmin Zhao préfère utiliser le Dictaphone et n’utilise pas Dragon régulièrement. « Depuis quelques mois, j’ai recommencé à utiliser la reconnaissance vocale et avec un peu de patience je vais vite en maîtriser le processus.
Il nous faudrait plus de temps pour apprendre à travailler avec ces outils. Cela permettrait qu’on puisse mieux s’habituer à une nouvelle manière de travailler, pour lire les manuels, pour suivre les procédures, et pour continuer à perfectionner leur utilisation. Cela serait aussi une incitation pour que certains se décident à les lire. Il faut aussi tenir compte du fait que la vitesse d’apprentissage n’est pas forcément la même pour tous. »

Selon un travail récent de l’université de Genève sur l’utilisation de la reconnaissance vocale dans une entreprise, il faut un engagement de la part de l’utilisateur sans quoi un système de ce type ne pourrait réussir. C’est un système qui devient très efficace, mais qui comme beaucoup d’autres, requiert son adhésion totale par celui pour qui il a été conçu: son utilisateur.

Up