|
|
normalisation |
"Désigne des mesures d'ordre numérique permettant d'apprécier la difficulté
ou la facilité de lecture, de compréhension et de mémorisation d'un texte.
Ces mesures sont calculées à partir de paramètres comme la longueur des mots,
la longueur des phrases, l'usage de certaines constructions de phrase (par exemple,
l'emploi excessif des pronoms relatifs) ou autres.
Un des indices classiques de la lisibilité est "l'indice de Gunning".
[%]
Une inférence désigne le résultat d'un raisonnement logique à base de règles par lequel on admet / rejette une proposition en fonction d'autres propositions ou faits déjà tenus pour vrais.
Le moteur d'inférence interprète des faits par des règles ("si ...., alors... ") pour produire soit de nouveaux faits ou règles, soit une conclusion.
Divers types de raisonnements (les raisonnements inductifs et déductifs, par exemple), sont automatisés à des fins d'application en intelligence artificielle et en traitement automatique des langue.
| Terme adopté en 1987 par l' IFD (International Federation of Documentation, ) pour désigner l'ensemble des activités métriques relatives à l'information, couvrant aussi bien la bibliométrie que la scientométrie [°] |
Le terme "infométrie" a été adopté pour désigner d'une manière générale
les analyses métriques de l'information (c'est-à-dire statistiques, probabilistes
et analyse des données), appliquées à la production d'une "information
de l'information" du type "qui fait quoi, en coopération avec qui,
où et quand".
A cet effet, on va traiter les informations de manière à pouvoir les classer, à les réunir dans des catégories qui rassemblent les unités d'information ayant des caractéristiques communes. Cette classification se fait automatiquement et a pour but principal de fournir une représentation visuelle de la structure des classes (graphes, cartes). Ces graphes permettent à l'utilisateur "de synthétiser de l'information, et par là même d'avoir une vision globale de l'environnement informationnel et d'évaluer la position des thèmes entre eux dans un espace géométrique de représentation."
A l'heure actuelle, s'associant aux recherches en sciences cognitives et en informatique (notamment en intelligence artificielle), et en linguistique informatique, l'infométrie peut contribuer au développement d'une véritable ingénierie de la connaissance objective. [#] En effet, les méthodes statistiques en indexation, comme outils d'aide à l'analyse et au repérage de l'information, permettent de traiter des corpus documentaires importants.
Méthode des Mots associés
Cette méthode utilisée en infométrie considère les mots-clés comme des indicateurs de connaissance et se base sur leurs cooccurrences pour mettre en évidence la structure de leurs relations (clusters). Cette démarche se déroule en deux étapes :
A. Génération de clusters: classification
- identification des unités signifiantes : indexation selon la méthode
de l'analyse statistique reposant sur la cooccurrence des termes - éventuellement
pondération (utilisation d'un indice statistique)
- comptage des occurrences et coocurrences afin d'extraire des documents
traités les expressions liées : constitution d'un dictionnaire
des groupes d'expressions
- constitution de clusters qui mettront en évidence les thématiques
présentes dans les documents. Un traitement informatique peut être
opéré à cette étape de classification tel
que la mise en évidence de relations entre les termes.
|
Détection des groupes d'expressions apparaissant souvent ensemble: intelligence artificielle, réseaux de neurones, reconnaissance de forme. Un tel groupe d'expressions est appelé un cluster.[$] Relations de classification : |
B. Cartographie : placement des clusters sur un
espace métrique
|
Exemple de recherche et présentation
graphique des résultats: Extrait du site de l'ADIT [//]
2. Cliquer sur un concept ci-dessous pour faire apparaître les concepts
associés : 3. Apparaît un groupe d'expressions fortement associées au concept maintenance de thésaurus. 4. Possibilité d'affiner la recherche : ajouter un terme à la requête, (+)ambiguïté de langue, ou cliquer sur un autre concept, phase sémantique. |
Signalons que les premières études d'application des
réseaux de neurones artificiels à l'infométrie ont abouti à définir la
méthode de classification des k-means axiales (variante documentaire des
K-means) et de cartographie par analyse en composantes principales (ACP).
[1] A partir d'une représentation vectorielle des
données, la méthode des k-means axiales considère l'ensemble des documents
comme un nuage de points plongé dans un espace géométrique où chaque dimension
correspond à un mot-clé.
|
Exemple de l'outil NEURODOC (INIST) [,] : la proximité entre les documents est définie par les mots-clés communs et la classification non hiérarchique exploite l ’algorithme des K-means axiales
|
Les données structurées sont stockées dans des BD hiérarchiques, relationnelles , orientées objet , bibliographiques ou autres. Les informations sont ainsi identifiables et leurs chemins d'accès sont déterminés à l'avance par le concepteur de la BD.
Les documents structurés sont des documents électroniques "représentés selon un format structuré, c'est-à-dire un format qui utilise des balises pour décrire la structure logique des documents. Souvent, la structure logique d'un document sera sa division en parties, chapitres, sections, etc., de même que certaines autres unités telles des notes de bas de page ou des références bibliographiques." [-,] La norme SGML permet de définir des documents structurés.
Les données non structurées sont des informations qui ne sont ni classées, ni identifiées, comme par exemple les documents sur votre ordinateur ou sur le WEB. Les documents à gérer sont composés de données textuelles, numériques, sonores, graphiques, et des images (fixes ou animées). Ce type d'information représente environ les neuf dixièmes de l'information utilisée dans les organisations.
|
SGML |
informatique documentaire |
Syn: réseau de réseaux, Internet, autoroute de l'information, information highway
Terme conçu pour décrire l'interconnexion entre les ordinateurs et les réseaux de télécommunications à travers le monde. [0]
L'Intelligence Artificielle (AI) (en anglais AI) a pour but de comprendre le raisonnement humain et de construire des machines intelligentes qui savent dune part entreprendre des actions à partir de mises en condition initiales, dautre part enrichir leurs potentialités par une accumulation de connaissances. A cet effet, la modélisation du monde réel et des connaissances sur celui-ci est essentielle. Le raisonnement est simulé par un programme informatique transformant ces représentations et produisant des actions : question - réponses - expliquation - actions - ...
Applications dans les domaines suivants : systèmes experts, interfaces de systèmes en langage naturel, reconnaissance des formes, reconnaissance vocale, interface homme/machine, ...
Qualifie les matériels, les programmes ou les conditions d'exploitation qui permettent des actions réciproques en mode dialogué avec des utilisateurs ou en temps réel avec des appareils.[*]
On parle d'interaction
quand un programme réagit à une entrée de l'utilisateur et, sur la base
de cette entrée, continue dans une direction particulière.
| Dans un questionnaire électronique, si l'utilisateur répond Non à la question 4, il saute directement à la question 9. |
L'interactivité est un élément de nombreux logiciels. Elle permet à l'utilisateur d'intervenir dans le déroulement d'un programme ou d'un jeu, en un mot de "communiquer" avec son ordinateur.[!]
Une interface désigne généralement "un composant qui sert à mettre en relation deux systèmes et qui contient des données sous une forme compréhensible pour ces deux systèmes." [!!]
Interlingua est un langage inventé qui est utilisé pour la traduction automatique. Il est le langage pivot vers lequel le langage naturel du texte source est traduit et à partir duquel le langage naturel du texte cible est généré.
Réseau informatique mondial composé d'un grand nombre de réseaux nationaux, régionaux, locaux et privés qui sont reliés par les protocoles de transmission de la famille TCP-IP (Transmission Control Protocol - Internet Protocol).
Depuis 1992, Internet Society, ISOC [~] est lorganisation internationale responsable de la coordination et de la coopération de lInternet, de ses technologies et de ses applications à travers le monde.
L'Internet Society, ISOC a absorbé en son sein des structures plus anciennes concernées par la normalisation d'Internet.
IETF : Internet Ingeneering Task Force [{]
IESG : Internet Ingeneering Steering Group [{{]
IAB : Internet Architecture Board
Toute la documentation est disponible électroniquement et gratuitement. [``]
FYI : For Your Information
Internet Draft
RFC : Request For Comments
RFC SETS
Identification d'un RFC
| RFC 1344 N.Borenstein, "Implications of MIME for Internet Mail Gateways", 06/11/1992, (Pages=9) (Format=.txt, .ps) |
Quelques exemples de standards qui ont un rapport avec le secteur TIL [```]
|
normalisation |
Internet Society |
EAGLES |
TEI |
W3C |
standard |
norme |
ISO |
Le terme "Intranet" comprend l'utilisation de la technologie
Internet sur un réseau interne à l'organisation. [#]
Cela permet d'optimiser la communication interne, et donc le fonctionnement,
d'une communauté ou d'une entreprise.
La rentabilité de l'Intranet étant beaucoup plus tangible que celle de
l'Internet, l'implantation de ce type de réseau connaît une croissance
constante.
| Le projet Fédénet : intranet de l'administration
fédérale en Belgique [$] Intranet des compagnies Alcatel Bell, Belgacom, Solvay, .... |
Quelques applications de L'Intranet
L'organisation internationale de normalisationest une
fédération d'organismes nationaux de normalisation de quelque 100 pays,
à raison d'un organisme par pays.
|
Les travaux de l'ISO s'étendent à tous les domaines de la normalisation, à l'exception des normes concernant la technologie électrique et électronique qui est du ressort du CEI (IEC) (Commission Electronique Internationale). Signalons le comité mixte ISO/IEC pour les technologies de l'information.
Le secrétariat central, situé à Genève
- coordonne les activités;
- veille à l'application des procédures de vote et d'approbation ;
- publie les normes internationales, le catalogue ISO 1994 contient un total de 9178 normes internationales.
Une norme ISO est une norme de jure (ou formelle)
| ISO/IEC 646:1991-12-15 Ed.3
15p. (H) JTC1/SC2 Information processing - ISO 7-bit coded character set for information interchange / Traitement de l'information - ISO de caractères codés à 7 éléments pour l'échange d'informations. |
Généralités - Terminologie - Normalisation
ISO 10241:1992 Ed.1 21p. (L) TC37/SC2
International terminology standards - Preparation and layout / Normes terminologiques internationales - Elaboration et présentationsISO 7154:1983 Ed.1 8p. (D) TC46/SC9
Documentation - Principes de classement bibliographiqueISO/IEC TR 12382:1992 Ed.1 245p. (XF) JTC1
index permuté du vocabulaire des TI
Technologies de linformation(TI) - Matériel de bureaux
ISO 8859 JTC1/SC2
Information processing - 8 bit Single-Byte Coded Graphic Charater Sets / Traitement de l'information - Jeux de caractères graphiques codés sur un seul octet
ISO 8859-1: 1987 Ed.1 7p. (D) JTC1/SC2 Alphabet latin 1 ...
ISO 8859-10: 1998 Ed.2 10p. (E) JTC1/SC2 Partie 10 Alphabet latin 6ISO/IEC 10646-1:1993 Ed.1 754p. (XQ) JTC1/SC2
Information Technology - Universal Multiple-Octet Coded Character Set (UCS) - Part 1: Architecture and Basic Multilingual plane / Technologie de l'information - Jeu universel de caractères codés à plusieurs octets - Partie 1: Architecture et table multilingueISO 8613-1:1989 Ed.1 54p. (R) JTC1/SC18
Traitement de linformation, bureautique, architecture des documents de bureau (ODA) et format déchange - Open Document ArchitectureISO/IEC 10744:1992 Ed.1 125p. (XE) JTC1/SC18
Information Technology - Hypermedia/Time-based Structuring language (HYtime) / Technologie de l'information - Langage de structuration temporelle /hypermédia (HyTime)
Délais du processus : Le défaut majeur que les producteurs et fournisseurs reprochent aux normes de l'ISO c'est sa lenteur d'élaboration : de cinq à sept ans s'écoulent en moyenne entre le dépôt des devis initiaux et de la publication finale du texte.
Accessibilité des normes : Aucun document technique des normes ISO n'est disponible électroniquement via un réseau électronique public. Il faut soit consulter ces documents auprès d'un organisme disposant d'un abandonnement aux normes ISO ou s'y abonner , soit acheter la norme. " Mais compte tenu de leur prix, ces normes demeurent inaccessibles pour un individu et même pour une PME uvrant dans le domaine TIL." [\\]
Traduction des normes : La plupart des normes techniques ne sont publiées que dans la langue d'origine : l'anglais. Soit que la terminologique du domaine existe uniquement en anglais, soit pour réduire les délais.
|
normalisation |
Internet Society |
EAGLES |
IEC |
TEI |
standard |
norme |
JTC1 |
La norme ISO/CEI 8859-1 définit le jeux de caractères Latin-1 où chaque caractère est représenté par 8 bits.
Le latin-1 est une extension à bits de l'ASCII 7 bits doublant ainsi le nombre de caractères admissibles (1-255).
|
normalisation |
ISO |
ASCII |
norme |
|
retour index lexique |
|
|
|
info supplémentaire |
Ensemble de caractères et de format de codes grâce auquel ces caractères peuvent
être représentés dans un système informatique.
Parmi les jeux de caractères les plus fréquents, on peut mentionner l'ASCII,
le PC-850, l'ISO-LATIN-1 et l'ISO-10646. [^]
Depuis 1987, "l'ISO s'est associée à la CEI pour entreprendre l'élaboration des normes concernant les technologies de l'information. Cette association a débouché sur la création du comité technique conjoint n°1 (ISO/CEI JTC1). Ce comité est, dans le secteur des technologies de l'information, un foyer très important de l'activité internationale en matière de normalisation des inforoutes. " [&]
[%] Glossaire de termes de ATO - Université UQAM http://www.ling.uqam.ca |
||
| [°] Informetrics 87/88 - L. Egghe et R. Rousseau, éds. - Amsterdam, Elsevier - 1988, p. IV |
||
[#] Aux sources de la scientométrie : scientométrie de Price - Xavier Polanco - INIST-CNRS, Nancy - http://www.info.unicaen.fr/bnum/jelec/Solaris/d02/2polanco1.html#fn19 |
||
[$] Recherche d'informations sur Internet - J. Thil - Technologies Internationales nº45, juin 1998 |
||
[I] Apport du traitement automatique de la langue et de l ’intelligence artificielle aux méthodes infométriques pour l ’analyse de l ’information - Yannick - 05/1999 - http://www.upmf-grenoble.fr/adest |
||
[//] Moteur de recherche ( Spielen, Digital Media) de l'ADIT, Agence pour la diffusion de l'information technologique - http://www.adit.fr/IndexM.html |
||
[1] Cette méthode s'inspire du formalisme neuronal du modèle de KOHONEN et applique une loi d'apprentissage d'Oja modifiée, du type "winner takes all" - Modèles Neuronaux pour l'Analyse de Données Documentaires et Textuelles" - Lelu A.- Thèse de l'Université de Paris 6 - 1993 |
||
[,] Une station de travail pour classer, cartographier et analyser l'information bibliographique dans une perspective de veille scientifique et technique - Luc Grivel, Claire François |
||
[-,] Conception et réalisation d'une interface-utilisateurs pour l'interrogation de bases de documents structurés - Martin Sévigny, Université de Montréal - 02/1996 - http://tornade.ere.umontreal.ca/~marcoux/grds/martin-td/chapitre-01.html |
||
[0] Lexique de Michel Cartier - Mmedium - 1999 - http://www.mmedium.com/ |
||
[*] Lexique de la Commission de terminologie informatique http://www-rocq.inria.fr/~deschamp/CMTI/glossaire.html |
||
[!] Dictionnaire de l'informatique et de l'Internet - A. Voss - Micro Application - 1998 |
||
[~] Internet Society - E-mail: isoc@isoc.org - http://www.isoc.org |
||
[`] Statistiques de Network Wizards - Internet Domain Survey http://www.nw.com |
||
[>] Les modalités de normalisation sont décrites dans RFC 2026 http://ds.internic.net/rfc/rfc2026.txt |
||
[-] Groupe NoTIAL - Les instances de normalisation - http://www.ceveil.qc.ca/notial/instance.html |
||
[{]
Site web de IETF http://www.ietf.org |
||
[{{] Site Web de l'IESG http://www.ietf.org/iesg.html |
||
[``]
http://www.nic.ddn.mil
- Des copies sont accessibles par FTP La documentation est accessible aussi http://www.normos.org |
||
[```]
les fichiers électroniques peuvent être obtenus 'service@nnic.ddn.mil' |
||
[!!] Dictionnaire informatique et de l'Internet - Micro Application - 1998 |
||
[#] Luc Peeters - l'Intranet : un nouveau moyen d'échange d'information - Internet in Business 97 seminar |
||
[^] Glossaire typographique et linguistique http://www.isoc.org:8080/glossaire/infex.fr.ftml |
||
[\] Normalisation et internationalisation - ACCT; RIOFIL; OQIL - 1995 http://www.ceveil.qc.ca/Normes/index.html |
||
[\\] En 1995, le coût était de l'ordre
de 35000 $ canadiens. Le CCN vendait , par exemple, la norme UCS
(ISO/IEC 10646:1993 ,754p. Ed.1) au prix de 601 $ canadiens. |
||
[+] Catalogue disponible http://www.iso.ch |
||
[&] Groupe NoTIAL - Les instances de normalisation - http://www.riofil.org/Notial/instance.html |
Dernière modification:
Ce site est optimisé pour Netscape 6.0 ou pour Internet
Explorer 4.0 ou ultérieur;
Et pour une résolution de 600/800 (Modifiez-la SI nécessaire).
Tous droits réservés © OTIL, 1999, 2002