Lexique : E

retour lexique

retour index lexique

info supplémentaire


Editeur

Terme général pour désigner un programme qui permet à partir d'un visuel d'introduire des données textuelles ou graphiques ou d'en modifier la disposition.

 

Editeur de texte

Un programme d'édition est une application destinée à créer et modifier des textes et, plus particulièrement, à traiter des fichiers ASCII. Pour le programmeur, il sert à traiter les instructions des programmes sources.
Un éditeur de texte possède certaines fonctions que l'on retrouve aussi dans dans les logiciels de traitement de texte, mais il est plus limité dans ses possibilités. On peut utiliser un traitement de texte pour créer des documents HTML ou VRML. [#]

 

Editeur HTML

Un éditeur HTML (Hypertext Markup Language) ou outil de création et de publication de pages Web est spécialement conçu pour la création de fichier HTML. Ceux-ci contiennent des commandes ( marqueurs,  balises ou HTML tags) qui permettent la mise en forme - l'édition - d'un document ASCII de telle sorte qu'il devient un document hypertexte lisible par un navigateur Web.

Webexpert, Frontpage, HotMetal, Dreamweaver....

outils inforoutiers

HTML

retour lexique

Etat finis

Une machine à états finis comporte différents tests représentés dans une structure de données et de fonctions qui déterminent les changements d'états en fonction des données d'entrée et déclenchent les données de sorties résultantes. Ces structures sont plutôt comparables à des tables dynamiques de décision.
Dans le traitement du langage, on les utilise pour des applications où une approximation de la description grammaticale correcte est suffisante pour fournir les résultats requis. [$]

Applications utilisant les techniques à états finis :
- Projet TRINDI : Task Oriented Instructional Dialogue
- Les étiqueteurs morpho-syntaxiques de Rank Xeros Research Centre
  retour lexique


Etiqueteur

Un étiqueteur (tagger) associe des informations (étiquettes) à des mots, à des phrases. Ce choix d'étiquettes : morpho-syntaxiques, sémantiques, grammaticales, sociologiques, pragmatiques ... varie selon l'objectif recherché. Les objets textuels ainsi catégorisés peuvent être repérés et utilisés à des fins de traitement, d'interprétation et d'analyse.

Exemple d'analyse morphologique de Xéros.

La coupe était dans la vitrine.

La    la+Masc+InvPL+Noun
La    le+Fem+SG+Def+Det
La    le+Acc+Fem+SG+P3+PC

coupe    couper+Imp+SG+P2+Verb
coupe    couper+IndP+SG+P3+Verb
coupe    couper+SubjP+SG+P3+Verb
coupe    couper+IndP+SG+P1+Verb
coupe    couper+SubjP+SG+P1+Verb
coupe    coupe+Fem+SG+Noun

était    être+IndI+SG+P3+Verb

dans    dan+Masc+PL+Noun
dans    dans+Prep
ETC.

L'étiqueteur rajoute des caractéristiques ou propriétés soit aux mots du lexique, soit aux mots en contexte. Par exemple, à partir d'une base de données, le logiciel procède à la génération du lexique des  formes simples. Le logiciel, via son module de catégorisation grammaticale, va affecter des étiquettes grammaticales à ce lexique. Sur base de ces étiquettes, le logiciel pourra ainsi, par exemple, rechercher les expressions complexes.

Grâce à l'ajout de valeurs de propriété grammaticale, le logiciel SATO (système d'analyse de textes par ordinateur) peut rechercher dans le texte des séquences de valeurs comme:
Nom commun + nom propre: Île Dupas, lac Saint-Pierre, rue Ste-Catherine

Cette catégorisation est :

  • automatique : étiquetage sur consultation de bases de données lexicales, banques de terminologie ou de dictionnaires sur support lisible par ordinateur. On applique donc une catégorisation antérieure au corpus.
  • assistée : l'utilisateur fait appel à des régularités de constitution de mots pour les mots non inclus dans le dictionnaire.
Les mots en "ion" = étiquette "nomCommun"
  • manuelle : l'utilisateur définit ses propres algorithmes.
Attribution d'une étiquette de zone=dep (département); qualité=lit (littéraire)

Un étiquetage automatique via la projection d'un dictionnaire sur le lexique du corpus peut être modifié manuellement (attribution d'un code spécifique).

 

lexique

retour lexique

Accèdez à des renseignements supplémentaires disponibles dans les Ressources de l'Ìnventaire

[$]Finite-State  - MLTT (Multilingual Theory and Technology), Rank Xeros Research Centre http://www.rxrc.xerox.com/research/mltt/fst/home.html

 

retour

[#] Vocabulaire d'internet - Cahiers de l'Office de la langue française - p.99 www.olf.gouv.qc.ca

 

Dernière modification:

Ce site est optimisé pour Netscape 6.0 ou pour Internet Explorer 4.0 ou ultérieur;
Et pour une résolution de 600/800 (Modifiez-la SI nécessaire).

Tous droits réservés © OTIL, 1999, 2002