Services
La reconnaissance vocale
Sergio da Silva, ONU/STIC
La reconnaissance vocale est un
ensemble des techniques ayant pour
but de permettre à un ordinateur de
reconnaître les signaux émis par la voix
humaine en vue d’en faire le traitement.
Dans la pratique, on installe un programme
spécifique dans l’ordinateur et
avec un microphone, on dicte les textes
qui seront traités par le programme en
question.
C’est en l’an 2000 que cette technologie
a commencé à être utilisée au Service
linguistique de l’ONU à Genève.
Nous avons contacté plusieurs utilisateurs
pour connaître davantage sur le
sujet:
Maggy Wachter, responsable du projet:
« Il a tout d’abord fallu commencer
par offrir une formation de haut niveau;
quelqu’un peut apprendre à jouer du
piano, mais avant de donner un concert
il y a un bout de chemin à parcourir…
L’ordinateur doit pouvoir vous comprendre
mais vous devez aussi savoir
comment lui parler. Un utilisateur qui
avait eu des difficultés à se faire comprendre
par l’ordinateur a trouvé la
solution: lui lire des contes de « La Fontaine
»: l’approche semble avoir été
bonne, puisqu’il a commencé à être
mieux compris. Qui a dit que les ordinateurs
n’avaient pas d’âme ?
Le programme retenu « Dragon Naturally
Speaking », a été initialement développé
pour ceux qui avaient des difficultés
d’ordre physique, ce qui les
empêchait d’utiliser le clavier.
Il nous permet de choisir la langue et
quelquefois aussi le pays où elle est parlée,
tel que l’anglais utilisé et prononcé
en Angleterre, aux Etats-Unis, en Australie,
en Inde ou en Asie du Sud est.
Si j’ai une idée dans mon trajet de la
maison au travail, je la dicte à mon enregistreur
de poche et en arrivant au
bureau, je transfère le fichier sur l’ordinateur.
Je vois alors, apparaître à l’écran
une phrase après l’autre, du texte que
j’ai dicté. Je peux ensuite faire des corrections
ou faire lire le texte à haute
voix par le PC.
Je pense que nous sommes dans une
période propice au développement de
l’utilisation de ces technologies.
Miguel Gonzalez fournit l’assistance
technique aux sections de traduction
française, anglaise, espagnole
et chinoise (les versions arabes et
russes n’étant pas disponibles): « Le
vendeur a initialement donné une formation
de base sur place et nous
l’avons complémentée avec des sessions
de formation utilisant le travail
réel des utilisateurs.
Ce nouvel interface avec l’ordinateur,
demande un certain temps d’adaptation
et d’apprentissage. Cela se répercute
initialement sur l’indice de productivité
de chacun, qui évoluera progressivement
en fonction de l’intérêt de l’utilisateur
pour les nouvelles technologies et
du temps qu’il dispose pour leur pratique.
L’actualisation régulière des versions
du produit contribue à l’intérêt des utilisateurs.
Carlos Salmon traduit vers l’Espagnol
et utilise la reconnaissance vocale
depuis 5 ans. Il lance Word 2000 sur son
PC, ouvre son microphone et commence
d’abord à lire mentalement les phrases
du document original en anglais ou en
français et les traduit de vive voix en
espagnol.
Le fichier avec le texte et son impression
corrigée sont ensuite envoyés au
pool.
« C’est un avantage de dicter et de
voir le texte devant mes yeux. D’autres
collègues utilisent l’enregistreur de cassettes.
Au début, nous devons être patients et
bien prononcer les mots. Après, il nous
est possible de parler avec un rythme
normal. Le système apprend au fur et à
mesure que nous corrigeons des fautes
et la productivité augmente. Si nous
avons un rhume, cela peut changer l’interprétation
de la voix, il nous faut alors
définir un autre profil d’utilisateur. »
Nigel Lindup est dans la section
anglaise de traduction. « Le taux d’intérêt
des utilisateurs par la reconnaissance
vocale, dépend de leur intérêt personnel
dans les nouvelles technologies.
L’attitude appliquée des utilisateurs dès
le départ est capitale pour le succès des
projets de ce type.
Il faut garder à l’esprit que la productivité
du traducteur ne dépend pas
exclusivement d’un outil ni de la
manière comme il est utilisé. L’outil peut
cependant aider à raccourcir la chaîne
de production. Dans mon cas, je préfère
travailler debout (peut-être que je ne
veux pas devenir un esclave de l’outil et
il faut que je le maîtrise) en lisant le
document source en français qui est affiché
en haut de l’écran et le document
objet avec la traduction anglaise qui
s’écrit dans une 2ème fenêtre juste en
dessous.
L’utilisation optimale de Dragon est
basée sur un bon mélange de l’utilisation
de la voix et du clavier pour faire
des corrections ».
Eric Duchateau, traducteur français,
utilise ce système depuis 2 ans et nous dit
que cela a changé sa façon de travailler.
Avant, avec le dictaphone, il dictait un
texte sans se poser trop de questions, ce
qui entraînait un gros travail de lecture
après. Maintenant, il produit plutôt un travail
fini, paragraphe par paragraphe.
« Si l’analyse de ce qu’on dicte n’est
analysée que par des calculs de probabilités
et pas par des analyses grammaticales,
on peut obtenir un résultat
erroné. Je teste une nouvelle version qui
indique un meilleur taux de reconnaissance
que celle que nous avons et nous
serons intéressés par son utilisation, à
condition que cela ne pose pas de problèmes
de compatibilité avec les logiciels
existants dans nos PC.
Patience, productivité, (il faut considérer
une baisse pendant l’apprentissage)
et changement radical de la façon
de travailler (toujours plus difficile pour
certains) sont les caractéristiques principales
de ce changement. A long terme,
on obtient une plus grande productivité
si on utilise la reconnaissance vocale
que si on utilise le dictaphone. Ma productivité
a augmenté mais cela peut ne
pas être le cas pour tout le monde ».
Jiazhi Zhao, traducteur chinois, utilise
60 à 70% de son temps dans un travail
de consultation de bases de données
terminologiques et de Google pour
son travail de traduction.
« J’utilise Dragon chaque jour même si
le résultat n’est pas parfait à 100%. Cela
vaut quand même la peine de l’utiliser,
car cela nous permet de gagner du
temps. Environ 25% de mes collègues
l’utilisent et la vitesse d’interprétation
est bonne. »
Xingmin Zhao préfère utiliser le Dictaphone
et n’utilise pas Dragon régulièrement.
« Depuis quelques mois, j’ai
recommencé à utiliser la reconnaissance
vocale et avec un peu de patience je vais
vite en maîtriser le processus.
Il nous faudrait plus de temps pour
apprendre à travailler avec ces outils.
Cela permettrait qu’on puisse mieux
s’habituer à une nouvelle manière de
travailler, pour lire les manuels, pour
suivre les procédures, et pour continuer
à perfectionner leur utilisation. Cela
serait aussi une incitation pour que certains
se décident à les lire. Il faut aussi
tenir compte du fait que la vitesse d’apprentissage
n’est pas forcément la même
pour tous. »
Selon un travail récent de l’université
de Genève sur l’utilisation de la reconnaissance
vocale dans une entreprise, il
faut un engagement de la part de l’utilisateur
sans quoi un système de ce type
ne pourrait réussir. C’est un système qui
devient très efficace, mais qui comme
beaucoup d’autres, requiert son adhésion
totale par celui pour qui il a été
conçu: son utilisateur.

|