Lexique : T (suite)

retour lexique

retour index lexique

info supplémentaire


Traduction automatique (TA)

Le rêve de la Tour de Babel sera-t-il une réalité dans la société de communication du 21ème siècle?

Définitions

La TA est l’application de l’informatique à la traduction de textes en langage naturel.

A partir du document source en français on obtient un document cible rédigé en anglais.

Un système de traduction automatique est un ensemble opérationnel fonctionnant en totale autonomie.
Automatiser la traduction, c’est vouloir repérer, capter, créer, calculer, coordonner des régularités pour pouvoir dire "Si A, alors B", autrement dit, créer des procédures inférencielles.

 

 

inférence

langage naturel

retour lexique


Système de Traduction Automatique (TA)

Système utilisant des informations linguistiques (informations phonologiques, morphologiques, syntaxiques et sémantiques)

  • La méthode directe

Chaque mot, syntagme de la langue source, est lié directement à l’unité correspondante de la langue cible. Corrélation unidirectionnelle (Anglais vers le français et non l’inverse)

SYSTRAN : 70.000 unités lexicales par langue et 35.000 expressions figées
  • La méthode par transfert
  • l’analyse décrit de manière linguistique le document source;
  • les règles de transfert décrivent les équivalences linguistiques et structurales entre les langues;
  • la génération utilise les données linguistiques de la langue cible et produit un document en langage naturel cible.

TAUM-METEO

  • La méthode interlangue par langage pivot 
  • le texte source est analysé et représenté dans les termes conformes aux règles du langage pivot qui est un langage neutre, artificiel, ou commun à plusieurs langues;
  • la génération du texte en langue cible s’opère à partir de cette représentation "pivot"
Représentation graphique des architectures de transfert de la méthode interlangue



Notons que la méthode par transfert et la méthode interlangue à langage pivot ne sont pas mutuellement exclusifs : un système de TA peut utiliser une interlangue, et pratiquer le principe du transfert sur les résultats intermédiaires lors de la phase analyse.

Système EUROTRA

 

Système utilisant des informations non linguistiques

  • Le système utilise des corpus d’exemples de traduction (textes traduits par l’homme)
  • par une approche statistique : il trouve la phrase cible qui a le plus de probabilité de correspondre à la phrase source;
  • par une approche basée sur les exemples = mémoire : le système emploie des exemples connus pour produire par analogie une nouvelle traduction.
Système de traduction développé par TRADOS
  • Le système se base sur des connaissances 

Il considère que l’on ne peut traduire que si l’on a des données de connaissances générales qui vont aidées à mieux comprendre la phrase.

 

 

mémoire de traduction

base de connaissances

langage naturel

retour lexique


Les limites de la TA

La TA est loin d’être parfaite mais elle permet de dégager le sens du texte original. Vous pouvez tester ce genre d’outil : http://babelfish.altavista.com/translate.dyn.

Les résultats, parfois, ne manquent pas d’humour :

Affiche sur la porte d’un médecin: Specialists in women and other diseases.

La TA se base sur:

  • la connaissance formelle des langues au niveau syntaxique et sémantique
  • le lien à établir entre les langues pour réaliser la TA.

Pour réaliser un système de TA, il faut avoir construit, pour chaque langue, les structures nécessaires au stockage de sa syntaxe : un objet dictionnaire et un objet grammaire.

Une langue n’est pas seulement un outil de communication. Elle traduit l’expérience et le vécu de ceux qui l’ont engendrée et utilisée. La sémantique définit justement les mots pris dans un contexte spatial, temporel, relationnel, culturel, irréel, etc. (rêve, illusion). Comment bien connaître la forme sémantique d’un mot afin de respecter ce sens dans la traduction ? Les références sémantiques d’un marin sont différentes de celles d’un paysan. Est-il toujours possible de traduire un univers sémantique vers un autre ?

De plus, il existe rarement une relation bi-univoque entre un ensemble de formes syntaxiques et un ensemble de concepts sémantiques.

Le mot pomme désigne, suivant le contexte, un fruit, un légume, un organe, une référence biblique, scientifique ou historique.

ambiguïté

dictionnaire

base de connaissances

langage naturel

retour lexique


La TA performante

La TA appliquée à un domaine restreint

La TA est plus performante quand elle s’applique à un domaine spécifique. Une analyse limitée aux champs syntaxique et sémantique du langage de ce domaine, appelé sous-langage, permet "d’adapter" le système et d’améliorer ainsi la qualité de la traduction.

le système TAUM-Météo de l’Université de Montréal traduit les bulletins météos régionaux du Canada de l’anglais vers le français.

Intervention humaine lors de la TA

  • La pré-édition au niveau du document source : corriger les erreurs orthographiques, syntaxiques ou stylistiques, segmenter des phrase, etc.
METAL invite l’utilisateur à annoter, à valider la sélection du document à traduire et à donner une description lexicale des mots identifiés comme inconnus.
  • La post-édition au niveau du document cible : Corriger des erreurs de traduction, lexicales ou terminologiques, réviser la traduction du système, etc.
SYSTRAN, LOGOS, offrent des outils (dictionnaires, grammaire, ...) pour assister la correction par l’utilisateur.
  • La traduction interactive intervient en cours de processus, le système fait appel à l’expertise humaine.
Les systèmes, ENTRAN, LIDIA, ITS, ... présentent à l’utilisateur un choix de sens, de paraphrase, etc.:

Le mot glace signifie-t-il : eau congelée - vitre - crème glacée ?
Ecole de cuisine lyonnaise signifie-t-il : école lyonnaise (de cuisine) - école de cuisine (lyonnaise) ?

Intervention sur le système

Outre l’enrichissement des dictionnaires, l’utilisateur a la possibilité, via la description de ses post-corrections, d’influencer les règles du système afin que ce type de faute, par exemple grammaticale, ne se représente plus.

Le système MAPTRAN

 

 

les limites de la TA

retour index


Traduction assistée par ordinateur (TAO)

Définition

La TAO consiste à offrir des outils de bureautique linguistique à des traducteurs ou à des rédacteurs désirant rédiger dans une autre langue.

Traduction par la machine

C'est l'ordinateur qui traduit mais la TAO se fonde sur l'intervention de l'utilisateur avant, pendant (le dialogue) et après la traduction. A l'opposé de la TA, "la TAO exige une technologie qui soit capable de se plier à la démarche naturelle du traducteur humain. On ne construit pas un traducteur robot, mais plutôt un poste de travail pour le traducteur humain." [#]
Cette méthode est favorisée actuellement par l'émergence, en TA, des approches à base de corpus.

Traduction humaine

C'est l'homme qui traduit mais il a accès à des outils de traduction facilement utilisables à partir de son programme de rédaction.

 

 

TAO

mémoire de traduction

retour lexique


PTT: Poste de Travail du Traducteur

Cette notion de PTT est plus un concept qu'un produit fixe. "Il s'agit de regrouper, sur la  plate-forme qu'offre l'ordinateur personnel, un ensemble de logiciels qui peuvent aider le traducteur à exécuter de façon plus efficace un certain nombre de tâches"[*] : consultation d'un dictionnaire (monolingue, bilingue), de bases de données terminologiques, comparaison de deux versions de traduction, interrogation de la base de données des textes déjà traduits, etc.

La composition d'un PTT varie selon la situation, les besoins et les goûts de l'utilisateur.

 

 

collocation

outils lexicographiques

retour lexique


Outil d’aide à la traduction (OAT)

Différents outils sont mis à la disposition des traducteurs et du public.

Dictionnaire électronique français/espagnol; Base de données terminologiques en français/anglais pour le secteur juridique; ...

Dictionnaire bilingue

A partir de son traitement de texte, le traducteur consulte son dictionnaire "en-ligne" qui lui propose pour un mot source un équivalent en langue cible ainsi que sa prononciation, sa catégorie syntaxique, sa flexion, les homonymes, des exemples d'usages, etc.

Un dictionnaire électronique bilingue est un dictionnaire dans lequel des expressions dans la langue source sont traduites dans la langue cible. Ils sont développés sur la base d'un corpus en langue source et un corpus en langue cible." [!]

 

dictionnaire

corpus

lexicographie

retour lexique


Accèdez à des renseignements supplémentaires disponibles dans les Ressources de l'Ìnventaire

[#] La TA, 50 ans après - P.Isabelle, P.Andries -  http://www.mmedium.com/dossiers/rali

retour

[*] Les dictionnaires bilingues et le PTT - E. Macklovitch - Recueil "Dictionnaires bilingues" - Duculot - 1996. p.176

retour

[!] Les différents types de dictionnaires bilingues - p.31 - C.Marello - les dictionnaires bilingues - Ed. Duculot/Aupelf uref

retour

Dernière modification:

Ce site est optimisé pour Netscape 6.0 ou pour Internet Explorer 4.0 ou ultérieur;
Et pour une résolution de 600/800 (Modifiez-la SI nécessaire).

Tous droits réservés © OTIL, 1999, 2002