|
| Webexpert, Frontpage, HotMetal, Dreamweaver.... |
Une machine à états finis comporte différents tests représentés dans une structure
de données et de fonctions qui déterminent les changements d'états en fonction des
données d'entrée et déclenchent les données de sorties résultantes. Ces structures
sont plutôt comparables à des tables dynamiques de décision.
Dans le traitement du langage, on les utilise pour des applications où une approximation
de la description grammaticale correcte est suffisante pour fournir les résultats requis.
[$]
| Applications utilisant les techniques à états finis : - Projet TRINDI : Task Oriented Instructional Dialogue - Les étiqueteurs morpho-syntaxiques de Rank Xeros Research Centre |
Un étiqueteur (tagger) associe des informations (étiquettes) à des mots, à des phrases. Ce choix d'étiquettes : morpho-syntaxiques, sémantiques, grammaticales, sociologiques, pragmatiques ... varie selon l'objectif recherché. Les objets textuels ainsi catégorisés peuvent être repérés et utilisés à des fins de traitement, d'interprétation et d'analyse.
| Exemple d'analyse morphologique
de Xéros.
La coupe était dans la vitrine.
|
L'étiqueteur rajoute des caractéristiques ou propriétés soit aux mots du lexique, soit aux mots en contexte. Par exemple, à partir d'une base de données, le logiciel procède à la génération du lexique des formes simples. Le logiciel, via son module de catégorisation grammaticale, va affecter des étiquettes grammaticales à ce lexique. Sur base de ces étiquettes, le logiciel pourra ainsi, par exemple, rechercher les expressions complexes.
| Grâce à l'ajout de valeurs de propriété
grammaticale, le logiciel SATO
(système d'analyse de textes par ordinateur) peut rechercher dans
le texte des séquences de valeurs comme: Nom commun + nom propre: Île Dupas, lac Saint-Pierre, rue Ste-Catherine |
Cette catégorisation est :
| Les mots en "ion" = étiquette "nomCommun" |
| Attribution d'une étiquette de zone=dep (département); qualité=lit (littéraire) |
Un étiquetage automatique via la projection d'un dictionnaire sur le lexique du corpus peut être modifié manuellement (attribution d'un code spécifique).
[$]Finite-State - MLTT (Multilingual Theory and Technology), Rank Xeros Research Centre http://www.rxrc.xerox.com/research/mltt/fst/home.html |
|
|
[#] Vocabulaire d'internet - Cahiers de l'Office de la langue française - p.99 www.olf.gouv.qc.ca |
Dernière modification:
Ce site est optimisé pour Netscape 6.0 ou pour Internet
Explorer 4.0 ou ultérieur;
Et pour une résolution de 600/800 (Modifiez-la SI nécessaire).
Tous droits réservés © OTIL, 1999, 2002