UNE EXPERIENCE PRATIQUE D'UTILISATION DE L'ANALYSE LINGUISTIQUE 
EN RECHERCHE D'INFORMATION : BILAN & PERSPECTIVES 
Ernest GRANDJEAN, Gerard VEILLON 
Laboratoire IMAG 
BP 53X - 38041 GRENOBLE c6dex 
France 
R6sum6 
I - PRINCIPE DE L'APPLICATION PIAFDOC 
I.i. M6thode d'analyse textuelle assistee 
par ordinateur 
I.Z. Probl~mes pos~s par les syst@mes 
documentaires 
I. 3. Fonctions du module linguistique pour 
l'indexation et l'interrogation. 
II - ANALYSE DES RESULTATS D'UNE 
APPLICATION REELLE 
II. I. 
II.Z. 
II. 3. 
ContrOle et validit~ des donn6es 
textuelles 
Choix des descripteurs et reprdsenta- 
lion de l'information 
R61e de l'interrogation. 
Ill - PROPOSITIONS POUR UN SYSTEME 
D'INFORMAT IONS TEXTUELLES 
III. i. Fonctions d'un programme 
d'indexation et d'interrogation 
III. i.I. Analyse morphosyntaxique et 
indexation minimale 
III. 1.2. Interpr6tation des fonctions et 
des textes s61ectionn6s 
III. 2. Implantation r6partie : d6centrali- 
sation des fonctions de cr6ation et 
d'acc~s par rapport aux tables. 
I - PRINCIPE DE L'APPLICATION PIAFDOC 
I.i. M6thode d'analyse textuelle assist6e par 
ordinateur 
Le programme PIAF est constitue par un 
ensemble de modules d'analyse linguistique. 
D6j~ pr6sent6 par ailleurs, nous rappellerons 
que l'objectif 6tail d'obtenir un outil suffi- 
samment performant pour permettre l'analyse 
du texte fibre, en faisant appe\[ ~ un principe 
d'interaction avec l'utilisateur. En particulier, 
il est toujours possible de modifier grammaires 
et dictionnaires en cours d'analyse. 
I.Z. Probl6mes pos6s par les syst6mes 
documentaires 
Zes techniques d'indexation automatique 
fond6es sur un 'antidictionnaire' conduisent 
reconnaitre pour mots-cl6s routes les variantes 
linguistiques de la m~me unit6 lexicale et ne 
traite pas les locutions. De plus, la moindre 
erreur typographique peut conduire A un 
mot-cl6 erron6. A l'interrogation, il n'est 
pas possible de tenir compte des fonctions 
syntaxiques ou des relations entre roots. 
I. 3, Fonctions du module linguistique pour 
l'indexation et l'interrogation 
Le programme PIAFDOC, d6riv6 de PIAF, a 
pour r61e de controler la conformit6 des 
donn6es textuelles, de choisir pour chaque 
unit6 lexicale un repr6sentant, qui peut 
d'ailleurs ~tre le repr6sentant d'une classe de 
synonymes, et de trailer une pattie des 
groupes de roots ou locutions. Pour cela, ii 
dolt poss6der un lexique complet du vocabu- 
laire de l'application. Ce programme est 
implant6 et exploit6 sur un centre serveur et 
disponible sur le r6seau TRANSPAC. Ii est 
exp6riment6 pour la constitution d'une base de 
donn6es politiques. A l'interrogation, le m~me 
proc6d6 doit conduire ~ r6utiliser le m~me 
ensemble de mots-cl6s par un traitement de la 
question identique A celui du texte. 
II - ANALYSE DES RESULTATS D'UNE 
APPLICATION REELLE 
II. I. Controle et validit6 des donn6es tex- 
tuelles 
L'analyse s6mantique du texte est \[ir~it~e par 
les ambiguit6s inh6rentes ~ tout syst6me 
formel. Le recours ~ l'utilisateur ne devrait 
intervenir qu'en cas de r6elle polys6mie, ou 
d'insuffisance du lexique. La fr6quence des 
interactions pourrait ainsi 6tre r6duite. 
~512 
II. 2. Choix des descripteurs et repr6sentation 
de l'information 
Ii est difficile de d~finir exactement les 
crit~res de choix des mots-cl~s. Une tendance 
naturelle ~ pr6ciser le plus possible le contenu 
du texte peut conduire g tenir compte de 
constructions linguistiques complexes in- 
accessibles dans l'analyse du texte libre, en 
contradiction avec le principe d'indexation 
automatique. 
ii. 3. R61e de l'interrogation 
L'interrogation doit faire appel au m~me 
traitement que l'indexation, afin de faire 
r6fer6nce g un ensemble de mots-cl6s norma- 
lis6s communs. Cependant, l'indexation 
syst6matique peut devenir bruyante, ou fournir 
des unit6s documentaires trop longues. Ii 
faut alors une relecture du texte ~t l'interroga- 
tion pour ne retenir que les unit6s docurnen- 
taires valides. 
III - PROPOSITIONS POUR UN SYSTEME 
D'INFORMATIONS TEXTUELLES 
Ill. 1. Fonctions d'unprogramme d'indexation 
et d'interrogation 
III. 1. 1. Pour 6viter route ambiguit6 dans le 
choix des roots, la seule solution consiste gt 
prendre une indexation minirnale, ind6pendante 
du domaine consid6r6, compl6t6e par une 
analyse morphosyntaxique conversationnelle 
qui dolt permettre de d6terminer les parties 
du discours dans la majorit6 des cas. 
III. 1.Z. Interpr6tation des questions et des 
textes s61e ctionn~s. 
L'interrogation en langue naturelle conduit tout 
d'abord ~t une indexation identique ~t celle de la 
cr6ation. L'ensemble des textes ainsi retenus 
sont ensuite parcourus par des techniques 
algorithmiques efficaces pour isoler les roots 
ou groupes de roots ayant servi g les s~lec- 
tionner. Une analyse linguistique plus fine 
doit permettre de v6rifier la coh6rence entre 
le segment de texte et la question. 
III. Z. Implantation r6partie : d6centralisation 
des fonctions de cr6ation et d'acc~s par 
rapport aux bases 
Le module linguistique peut raisonnablement 
6tre implant6 sur petit mat6riel, pour permettre 
ainsi un traitement local des textes ou des 
questions ind6pendant des bases de donn6es 
utilis6es. 
..... 513 
