A. ANDREEWSK¥- C. FLUHR 
EXPERIENCE DE CONSTITUTION 
D'UN PROGRAMME D'APPKENTISSAGE 
POUR LE TRAITEMENT AUTOMATIQUE DU LANGAGE 
Dans ce travail, on pr~sente une m6thode d'apprentissage permettant 
partir d'un texte donne de constituer une syntaxe capable de lever 
les ambiguit& grammaticales du langage. 
Pour cela, on prend un texte T que ron code enti~rement en asso- 
ciant ~t chaque mot une cat~gorie grammaticale, celle qu'il a dans le 
texte. 
Par exemple: 
LA 
MONTRE 
EN 
OR. 
DE 
MON 
ONCLE 
EST 
ARTICLE 
SUBSTANTIF 
-~ PR.EPOSITION 
-~ SUBSTANTIF 
--~ PREPOSITION 
ARTICLE POSSESSIF 
--~ SUBSTANTIF 
-~ VERBE CONJUGUE 
ANCIENNE -~ ADJECTIF 
Par ailleurs, lorsque une phrase est fondamentalement ambiguE on 
doit reproduire la m~me phrase avec les interpretations possibles. 
Par exemple: 
On aura: 
LE ~ ARTICLE 
Le pouvoir me serait agrdable. 
POUVOIR ~ SUBSTANTIF 
etc .... 
et 
LE -~ PRONOM PREVERBAL 
POUVOIR. -~ INFINITIF 
110 ^. ANDREEWSKI- C. FLUHR 
On constitue ensuite on dictionnaire, qui accumule les divers va- 
leurs grammaticalcs possibles des roots du texte T. Par exemple on 
pourra avoir ainsi: 
LA 
MONTP~E 
EN 
Oil. 
EST 
etc .... 
(ARTICLE ou SUBSTANTIF ou PRONOM 
PREVER.BAL) 
(SUBSTANTIF ou VER.BE CONJUGUE) 
(PREPOSITION ou PR.ONOM PREVER.BAL) 
(SUBSTANTIF ou CONJONCTION) 
(VERBE CONJUGUE ou SUBSTANTIF) 
De cette faqon on obtient un dictionnaire des roots de T avec leurs 
diverses valeurs grammaticales possibles dans T, on peut alors rendre 
le texte T ambigu en rempla~ant les valeurs grammaticales de chaque 
mot dans le texte par les valeurs accumul6es. On obtient ainsi un texte 
Ta. I1 est clair que T repr~sente la ~ vraie r6solution ~ du texte Ta. 
On fait alors un relev6 des configurations binaires et ternaires r&ol- 
vantes. On proc~de de la faqon suivante: 
Soit par exemple (V1, V~, V3)~ les trois valeurs d'un mot de 
morphologie M * et de position i, dans Ta. 
-- Soit V~ sa valeur dans T. 
On note (V~, V~, Vs)~ le passage de T a ~ T. 
Supposons que le mot de position i+ 1 ait la morphologie M h 
et les valeurs (W~, W~), +~ avec la transition (W~, W2)~:+~ lots du 
passage de Ta ~t T. 
Alors il est possible de faire la corr61ation binaire: 
(v1, v,, v )t si (wl, 
ce que l'on note: 
^ wo), 
Cela 6tant, on peut faire un relev6 de toutes les transitions des cor- 
r61ations binaires, quels que soient i, k, h, c'est-~-dire de faire un r6per- 
toire de toutes les r6solutions associ6es deux k deux. 
L'apprentissage de ces r6solutions binaires est relativement rapide 
puisque des mots de morphologie diff&ente peuvent avoir la m~me 
liste de valeurs. 
PROGRAMME POUR LE TRAITEMENT AUTOMATIQUE DU LANGAGE 111 
L'association binaire dcrite peut ~ son tour devenir ambiguE, c'est 
~t dire pour i :~ j on aura: 
(vl, v~, v3),^ (w,, w~),+l et (v. v~, v~)~^ (w~, w,)j+l 
Par exemple soit les deux phrases: 
FI: Le programme entre dans la machine. 
F2:11 le programme entre midi et deux heures. 
Alors on voit que l'association 
(ARTICLE, PRONOM PREVERBAL)^ (SUBSTANTIF, VERBE 
CONJUGUE) 
a une premiere resolution dans F1 et une seconde dans F2. 
Pour essayer de lever l'ambiguitd de l'association binaire, on peut 
utiliser les associations ternaires, c'est ~t dire des expressions de la forme: 
(V~, v~, v~),^ (w~, ~),+ 1^ (vl, Y~, ~),+~ 
On recommence ensuite pour les associations ternaires la mSme 
procedure que pour les associations binaires. 
La mdthode de resolution employee ensuite pour l'analyse peut 
~tre dEcrite ~ l'aide d'un exemple: 
Soit la phrase: Ce programme commence bien. 
Le repertoire des resolutions binaires analyse tout d'abord Ce 
Ce qui donne les resolutions suivantes: 1 
(PONCTUATION)0 ^ (ARTG, Vt~OC)l 
(PONCTUATION)0 ^ (ARTG, PI~OC)I 
Les valeurs possibles de Ce sont: ARTG, PROC 
Si on analyse ensuite Ce programme cela donne les resolutions sui- 
vantes: 
(A~.TG, ~ROC)I ^ (SUBS, SUSU, VT), 
(ARTG, PR.OC)I ^ (SUBS, SUSU, VT)2 
, ARTG = article g~n&al 
SUBS = substantif compl~ment 
VT = verbe conjugu6 
PROC = pronom compl~ment 
SUSU = substantif sujet 
112 ^. ANDREEWSKY - C. PLUHR 
Le valeurs possibles de Ce sont ici: ARTG 
La r~solution pour Ce sera donc l'intersection des deux listes 
(AI~TG, PROC) fl (AI~TG)= AI~TG (ici N est l'intersection en- 
sembliste). 
Le processus continue, ainsi de proche en proche, d'attribuer 
chaque mot la valeur grammaticale compatible avee les valeurs re- 
pertori6es des mots et des associations binaires. 
L'ANALYSE PAR DEFAUT 2 
L'analyse par d~faut peut ~tre d~finie comme suit: 
Soit tm texte T dont on veut effectuer l'analyse automatique. Sup- 
posons qu'un certain hombre de roots de T soient inconnus du diction- 
naire. En d'autres termes, au cours de l'apprentissage ces mots n'ont 
pas encore &6 rencontres. On se propose alors d'utiliser les informa- 
tions syntaxiques accumul~es (corrdlations binaires et ternaires) pour 
attribuer aux mots inconnus du dictionnaire la ou les valeurs com- 
patibles avec le contexte (valeurs par d~faut). 
La possibilitd d'une telle op&ation est dvidente. 
En effet, soit une phrase q~ de la forme: M1 M~ ... Mi Xj Mr' M, 
oh Xj. est un mot inconnu du dictionnaire, auquel on dolt donc attri- 
buer une valeur par d~faut. 
Supposons pour simplifier les chose, que ni Mi ni MK ne soient 
ambigus. I1 correspond donc g Ms une valeur Vi et ~ MK une valeur 
V~c. I1 existe un ensemble de correlations binaires ayant comme terme 
initial V/. Elles s'~criront: 
(r,, (r,, (r,, 
oil Vx~, V,~, ... Vfc peuvent a priori ~tre consid&~es comme l'une des 
valeurs possibles de X~ dans le texte ~tudi~. 
De m~me il existe un certain nombre de corrdlations binaires 
possibles ayant V/c comme valeur terminale. Elles s'~crivent: 
(V;b V/c) (V~, V/c) ... (VJo V~:) oh t ~ 8 a priori. 
Voir comraentaires 5 et 6. 
PROGRAMME POUR LE TRAITEMENT AUTOMATIQUE DU LANGUAGE 113 
La pattie commune des ensembles 
... .... 
constituera la ou les valeurs par d6faut de X i. 
Si L1 VI L2 ~-O, il y a incompatibilitY, on pourrait afficher un 
message signalant cette incompatibilitd, mais ce cas ne se produit en 
fair jamais. 
Si L1 17 L2 ~ 0, la partie commune des deux listes est propos~e 
comme analyse par d~taut. 
Cette strat6gie n'est 6videmment pas la seule possible. 
Le proc6d6 d'analyse par d~faut pr~sente un certain hombre d'aspects 
linguistiques importants. 
On peut souligner en particulier les faits suivants: 
LI: un tel syst6me fair apparaltre les notions de classes de mots, 
de grammaire et de syntaxe produites par le corpus sur lequel est ef- 
fectu6 l'apprentissage. 
L~:il permet de connaltre la r~action de la syntaxe apprise, 
un mot inconnu, avant de ddcider du statut de ce mot. 
La: il permet d'~valuer la redondance syntaxique d'un certain 
texte dans la mesure ot~ l'on peut toujours effectuer l'apprentissage 
sur une partie de ce texte et analyser le reste par d6taut. 
/,4: selon que ranalyse par d6faut est effectu~e k l'aide des cor- 
r61ations binaires ou ternaires, on peut mesurer rimportance dans la 
langue de ces correlations. 
Ls: on peut essayer d'utiliser ce syst~me dans le but de simuler 
rapprentissage de la langue par l'enfant ou l'adulte, sous son aspect 
grammatical et syntaxique. Cependant on doit prendre ici une pr& 
caution et souligner que sur un texte donn~, l'apprentissage tait par 
programme est optimum, alors que pour un ~tre humain il y a des 
pertes assez nombreuses de l'information enregistr6e. 
D'autre part, ranalyse par d~faut pr6sente aussi des avantages du 
point de vue de la souplesse et de la performance de l'algorithme d'ap- 
prentissage. 
En effet: 
Performance: dans la mesure of l'on 6vite \]e codage de roots d6fit 
connus du dictionnaires et dans la mesure off, comme le montrent 
d6jk les r6sultats, on trouve presque toujours dans la d6cision par d& 
taut au moins !a bonne valeur, on a la possibilit6 d'acc~l~rer l'accumu- 
lation des donn¢es de rapprentissage. 
114 ^. ANDREEWSKY- C. FLUHR 
Souplesse: 
81: l'analyse par d~faut, permet de ne pas rejeter une phrase 
dans laquelle il y a relativement peu de mots inconnus. (Dans les pro- 
grammes des grammaires arborescentes, un seul mot inconnu rejette 
toute la phrase). 8 En pratique, on parvient avec les correlations bi- 
naires ~t obtenir une analyse par d~faut qui n'est pas trop ambigu~ en 
pr6sence d'un mot inconnu entre deux connus et mflme en presence 
de deux roots constcutifs inconnus. Par contre, trois roots cons~cutifs 
inconnus ne peuvent plus 8tre analysts. Cependant, ce dernier cas, au 
bout d'un certain degr6 d'apprentissage, se rencontre rararement. Ainsi 
dans le texte de 1000 roots analys6 par d~faut (voir commentaire 6) 
on ne trouve le cas de trois roots cons6cutifs inconnus que deux lois. 
S~: D'autre part, la possibilit~ d'une analyse par d~faut permet 
d'envisager ~t un certain moment l'arr@t de rapprentissage, ce qui dans 
certaines applications peut ~tre important. 
$8: Enfin, il est prtvu, pour faciliter l'introduction des donn~es 
linguistiques, de rdaliser tout le syst~me en conversationnel. 
En pratique, une premiere experience a 6t~ rtalis6e, dans laquelle, 
apr~s avoir effectu~ un apprentissage sur 4000 roots, on a pris au hasard 
dans le m~me ouvrage 1000 autres roots qui ont 6t6 analysts par dtfaut 
~t l'aide de corrtlations binaires. 
Les premiers rtsulats montrent que lorsqu'on a un mot inconnu 
entour6 de deux mots connus, le hombre de valeurs attributes par 
dtfaut est faible. 
Bien entendu, remploi de corrtlations ternaires ne pourra qu'amt- 
liorer ces rdsultats. D'autre part, il arrive que dans certains, cas on ne 
puisse pas analyser un mot, lorsque le mot qui le precede, ou bien est 
inconnu du dictionnaire, ou bien contient encore un trop grand hombre 
d'ambiguitts. 
Enfin, soulignons que des roots enregistrds dans le dictionnaire 
avec une analyse fausse ne peuvent ~tre relevts ~t raide de ranalyse par 
dtfaut, qui ne peut contester les valeurs attributes aux roots par l'ap- 
prentissage. Pour connaltre la r~action par dtfaut du syst~me ~ ces 
mots, on doit les supposer inconnus, c'est-~-dire les effacer du diction- 
naire. 
3 Dans une arborescence une d~cision par dtfaut entratne l'exploration d'un grand 
hombre de branches qui sera variable selon la position du mot dans l'arborescence. 
PROGRAMME POUR LE TRAITEMENT AUTOMATIQUE DU LANGAGE 115 
CONCLUSION 
L'exp~rience effectude ne repr~sente pour l'instant qu'un essai de 
constitution d'un algorithme d'apprentissage d'analyse syntaxique, ef- 
fectu~ sur 4000 mots. Elle a permis de tester la re&bode et le pro- 
gramme et de confirmer les hypotheses de travail. 
A - Elle montre pour la partie manuelle: 
mque le temps de constitution d'un tel programme peut &re 
de l'ordre de deux ou troix mois. 
que le temps de constitution de l'~chantillon linguistique est 
de l'ordre d'une dizaine de jours pour 4000 mots. 
par contre le temps n~cessaire pour choisir les categories gram- 
nlaticales peut &re plus long et d~pend du syst~me grammatical adopt& 
B - Par ailleurs le traitement automatique a permis la constitu- 
tion d'un dictionnaire avec les diverses cat6gories grammaticales re- 
latives ~ chaque mot, et d'une syntaxe permettant de lever les ambi- 
gu~t6s grammaticales, le r~pertoire syntaxique et le dictionnaire su- 
bissant un apprentissage au fur et ~t mesure de l'extension du corpus. 
Le niveau d'analyse qui est pr~vu pour l'instant, est celui d'tme 
analyse grammaticale comprenant environ 80 catdgories grammaticales 
et la recherche du sujet et de certains groupements (les adjectifs relatifs 
aux substantifs et les adverbes regroupds autour des verbes). Les temps 
d'analyse sont tr~s courts par rapport aux temps n6cessaires dans les 
analyses en arbres. 
Le traitement effectud pourra servir de pr&aitement pour l'analyse 
des niveaux sup6rieurs, l'in6galitd suivante &ant v6rifide: 
temps de traitement temps de traitement Temps de traite- 
pour la levde des pour obtenir les ni- ment par une stra- 
ambigtfftds gram- q- veattx linguistiques << t6gie globale 
maticales plus dlev& arborescente 
C - I1 est important de remarquer que la connaissance du niveau 
grammatical peut sufl~re pour des applications telles que la documen- 
tation automatique. Un algorithme d'analyse documentaire utilisant 
les r~sultats d'analyse obtenus par le syst~me d~crit est en voie d'~la- 
boration et sera expos6 ultdrieurement. 
D - L'analyse par d~faut constitue enfm un dl~ment linguistique 
important du syst~me ~labor& Elle est effectu~e ~t l'aide des corrdlations 
binaires et il est pr~vu de l'am~liorer en utilisant les correlations temaires. 
116 A. ANDREEWSKY-C. FLUHR 
COMMENTAIKES ET KESULTATS EXPER.IMENTAUX 
COMMENTAIRE 1. 
On a ci-dessous un extrait de l'6chantillon linguistique tel qu'il est cod6 
manuellement, ~ l'exception de la numeration qui est automatique. 
Pour l'instant 4000 roots ont ~t~ cod~s de cette £aqon. 
Cette premiere op&ation est la seule operation manuelle. 
445 LA .................... ~ AR.TD 
446 PREMIERE .................... -> ADJA 
447 FOIS .................... ~ SUBS 
.................... -+ tLESP 
.................... -+ PI~OI 
.................... -+ PI~OV 
.................... -~ VTI 
.................... ~ ADVA 
.................... -+ RECS 
.................... -+ AIkTG 
.................... -+ SUSU 
.................... -~ VIPO 
.................... -+ PREP 
.................... -+ ARTD 
.................... -+ ADJA 
448 ! 
449 IL 
450 NOUS 
451 FAUT 
452 D'ABOR.D 
453 CONSTATEI~ 
454 QUE 
455 CES 
456 CALCULATEUKS 
457 
458 AVEC 
459 L' 
460 IMMENSE 
COMMENT-A.IRE 2. 
Ci-apr~s, figurent un certain nombre de mots avec les propri~t6s accu- 
muldes correspondantes. 
On trouve de m~me les probabilit6s absolues d'apparition des mots et 
les probabilit6s relatives des propri6t6s lorsqu'on a tir6 le mot. (Les probabi- 
lit~s ont ~t~ prises en cours d'apprentissage sur 816 mots). 
6 Ainsi pour * D'~> on trouve Probabilit6 = 0,0073439 = 81----6 
1 pour la valeur PREA on trouve 0,16 = ~- 
pour la valeur ARTI on trouve 0,33 = 2 6 
3 pour la valeur Pt~EP on trouve 0,50 = 
6 ~tant le nombre de fois off <~ D'>> est rencontr6. 
PROGRAMME POUR LE TRAITEMENT AUTOMATIQUE DU LANGAGE 117 
CE MOT APPARAIT 
- PR.EA : 1. 
- AR.TI : 2. 
- PR.EP : 3. 
CE MOT APPAR.AIT 
- ADVA : 1. 
- ADVP : 1. 
CE MOT APPAR.AIT 
- PREP : 2. 
CE MOT APPAR.AIT 
- PREA : 9. 
- AR.TI : 1. 
- PR.EP : 16. 
6. FOIS 
2. FOIS 
2. FOIS 
26. FOIS 
D ~ 
..................... 
PROBABILITE : 0.0073439 
PR.OBABILITE : 0.1666666 
PR.OBABILITE : 0.3333333 
Pl~OBABILITE : 0.5000000 
D'ABOR.D 
..................... 
PROBABILITE : 0.0024480 
PI~OBABILITE : 0.5000000 
PROBABILITE : 0.5000000 
DANS 
..................... 
PR.OBABILITE : 0.0024480 
PI~OBABILITE : 1.0000000 
DE 
..................... 
PR.OBABILITE : 0.0318237 
Pl~OBABILITE : 0.3461538 
PR.OBABILITE : 0.0384615 
PROBABILITE : 0.6153846 
COMMENTAIRE3. 
On trouve ci-dessous la syntaxe des transitions binaires pour lesquelles 
au moins une des deux listes des roots de la source poss~de au plus un 61& 
ment. (Par exemple si la source a la forme ARTD * VT elle ne figure pas 
dans le r~pertoire que nous donnons ici). 
Lorsqu'il y a plusieurs r~solutions possibles, on trouve un message: AM- 
BIGUITE, qui facilite le d~pouillement des r~sultats. 
27 ADJ * PREA PREP PROV: 
-ADJ * PREA 
28 ADJ * PREA PR.EP R_ECC: 
-ADJ ~ PR.EP 
29 ADJ * RECS R'ENP R.GSU R.GSV RIF R.SUM VIPF 
VIPO VIR.I : 
~oo**~***~*~*~**~ AMBIGUITE 
30 
31 
32 
-ADJ ~' RECS 
-ADJ '* R.ENP 
-ADJ o RIF 
-ADJ * VIPF 
-ADJ * VIPO 
ADJ o R.ECS R.ENP R.GSU R'GSV R'SUM: 
-ADJ o RECS 
ADJ * RECS R.ENP R.GSV RSUM: 
-ADJ * R.ENP 
ADJ * R.ECS R.GSV: 
-ADJ * tLECS 
118 A. ANDREEWSKY- C. PLUHR 
33 AD ADJP ~ ADVP PREC 1LECC ILECS : 
-ADJ * RECS 
34 ADJ ADJP ~ ARTI PILEA PREP: 
-ADJP o PREP 
35 ADJ ADJP ~ IVTE VTE: 
-ADJP ~ VTE 
36 ADJ ADJP ~ PONF RECS tLESP: 
-ADJ ~ RECS 
37 ADJ ADJP o RECS RENP 1LGSU RGSV RIP RSUM 
VIPF VIPO VIRI : 
~*o~*~ AMBIGUITE 
-ADJ ~ R.ECS 
-ADJ * RECS 
38 ADJA ~ ADJP SUBS : 
-ADJA o SUBS 
39 ADJA ~ RECS R.EN-P R.GSU RGSV RSUM : 
-ADJA • R_ENP 
40 ADJA * SUBS SUSU : 
• ~o~*~* AMBIGUITE 
-ADJA ~ SUBS 
-ADJA ~ SUSU 
41 ADJA * SUBS SUSU VPE : 
-ADJA ~ SUSU 
42 ADJA ADJC ADVL ADVP ~ PREA: 
~*J*~u~uo~o AMBIGUITE 
-ADVL ~ PREA 
-ADVP ~ PREA 
43 ADJA ADJC ADVL ADVP ~ SUBS: 
-ADJA ~ SUBS 
-ADJC ~ SUBS 
COMMBNTAIRE 4. 
Dans la page on trouve la liste des transitions temaires pour lesqueUes 
(comme pour le commentaire 3 relatif aux transitions binaires) au moins 
une des deux listes des roots de la source poss~de plus d'un 61~ment. 
S'il y a ambiguitY, elle est marquee d'un message AMBIGUITE. 
87 ADJA * SUBS ~ PONP tLECS RESP : 
• *********o,,u,,**** AMBIGUITE 
-ADJA * SUBS * PONF 
-ADJA * SUBS * ILECS 
-ADJA * SUBS * RESP 
88 ADJA '.' SUBS ~' PREA PREP : 
-ADJA '* SUBS ~ PREP 
89 ADJA * SUBS ~' RECS tLENP RGSU RGSV ILIF RSUM 
VIPF VIPO VILLI : 
PROGRAMME POUR LE TRAITEMENT AUTOMATIQUE DU LANGAGE 119 
-ADJA ~ SUBS o RENP 
-ADJA ~ SUBS ~ KIF 
-ADJA • SUBS o VIPF 
90 ADJA ~ SUBS ~ RECS RENP R.GSU R.GSV RSUM : 
-ADJA ~ SUBS ~ RENP 
91 ADJA ~ SUBS SUSU ~ ADJP : 
-ADJA ~' SUBS ~' ADJP 
92 ADJA '~ SUBS SUSU ~ ARTI PREA : 
-ADJA ~' SUBS * PREA 
93 ADJA * SUBS SUSU * ARTI PREA PREP : 
~~*~*~ AMBIGUITE 
-ADJA * SUBS * PREP 
-ADJA * SUSU o PREA 
94 ADJA ~' SUBS SUSU ,~ PONF RECS RESP : 
-ADJA ~' SUBS ~, RECS 
95 ADJA ~ SUBS SUSU ~' PR.EA PREP RECC : 
-ADJA * SUBS o pREp 
96 ADJA o SUBS SUSU ~ VT 
-ADJA ~ SUSU ~ VT 
97 ADJA ~ SUBS SUSU VPE ~ AR.TI PREA : 
-ADJA ~ SUSU ~ PREA 
98 ADJA * SUSU ~ AR.TI PREA PREP : 
-ADJA * SUSU * PREP 
99 ADJA ~ SUSU • RECS RENP R.GSU R.GSV KIF RSUM 
VIPF V1PO *giRl : 
-ADJA * SUSU * RIF 
-ADJP * PROV * VT 
144 ADJP ~ ARTD PROV ~ SUBS 
-ADJP • ARTD ~ SUBS 
145 ADJP ~ ARTI PREA ~ ADJA ADPR SUJT : 
-ADJP ~ PREA ~ ADJA 
146 ADJP ~ ARTI PtLEA ~ ADJP SUBS SUSU : 
-ADJP ~ PREA * SUBS 
147 ADJP ~ AR.TI PREA ~ SUBS : 
-ADJP ~ PREA ~ SUBS 
148 ADJP ~ ARTI PREA ~ SUBS SUSU : 
-ADJP # PREA ~ SUBS 
149 ADJP ~ AR.TI PREA PREP ~ ADPR. AR.TI : 
-ADJP ~ PREP ~ ARTI 
COMMENTAIRE 5. 
On trouve ci-dessous le r3sultat de ranalyse de phrases constitutes avec 
les roots du dictionnaire avec des valeurs qui peuvent atre diff6rentes de celles 
connues du dictionnaire et dam des combinaisons qui sont diff6rentes du 
texte utilis~ pour rapprentissage. 
LE (D):ARTD 
.......................... CALCULATEUR. (D): SUSU 
ELt~CTRONiQOE .... (D):ADJP 
......................... EST (D):VTE 
.......................... BIEN (D):ADVA ADVI ADVP SUBS 
.......................... BON (D):ADJA 
.......................... POUR. (D):PREP 
......................... L (D):ARTD 
.......................... HOMME (D):SUBS 
S' (D):R.ECS tkESP 
......................... IL (D) :PI~OP 
......................... NE (D):NE 
LE (D):ARTD PR.OV 
POSSEDAIT (D):VT 
.......................... PAS (D):ADVP 
.......................... ._ 
....................... (D):RECS 
IL (D):PtkOP 
........................... NE (D):NE 
......................... SE (D):PR.OV 
........................ SERAIT (D):IVTE VTE 
......................... PAS (D):ADVP 
......................... POSE (D):ADJ 
SUR. (D):PR.EP 
LA (D):AR.TD 
......................... LUNE (D):SUBS 
.......................... • 
. ....... (D):I~ECS 
LA (D):AR.TD 
PASSf(:)I~ ............... (D):SUSU 
.......................... ET (D):RECS R SUM 
......................... LA (D):AR.TD 
COLI~i~ ................ (D):SUSU 
......................... DES (D):PREA 
........................... GENS (D):SUBS 
......................... CR.EENT (D):VT 
i_~ ..................... (D):ADPR. AI~TI 
......................... 
EMBOUTEILLAGE (D):SUSU 
i~ScT~Kdt~fN-Aii~- (D):ADJA 
.......................... SUP-, (D):PREP 
.......................... LES (D):AR.TD 
......................... MARCHES (D):SUBS 
.......................... 
• . ................... (D):RECS 
MEME SI (D):LREC 
.......................... BIENTOT (D):ADVL 
......................... LES (D):ARTD 
H6MiVi~S .............. (D):SUBS 
ilEN.~IEN*i" ............ (D):VT 
.......................... SUP,. (D):PREP 
.......................... LA (D):AP.TD 
.......................... LUNE (D):SUBS 
.......................... 
• (D):RECS 
LEUR. (D):AP.TP 
~MBiYf6"f,f ............ (D):SUSU 
.......................... SER.AIT (D):IVTE VTE 
......................... LA (D):ARTD PROV 
MEME (D):ADJA ADJG ADVL ADVP 
..................... • (D):PONF R.ECS RESP 
VOILA (D):IVTE 
DES (D):AR.TI PR.EA 
AUTOS (D):SUBS 
..................... • (D):RESP 
LEUR. (D):ARTP PR.OV 
USURE ,(D):SUBS 
..................... ETAIT (D):VTE 
..................... FABULEUSE (D):ADJA 
• . ................. (D):RECS 
LE (D):AR.TD 
COMPTABLE (D):SUSU 
..................... SOUFFR.E (D):VT 
..................... QUAND (D):R.ECS 
J, ES-': ............. (D):ARTD PR.OV 
.kOi~b~k;fifg" (D):SUBS 
TRICHEUR.S (D):SUBS 
INTER1R.OGENT (D):VT 
..................... LA (D):AR.TD 
BOULETTE (D):SUBS 
..................... • (D):R.ECS 
LES (D) :ARTD 
_A_.I~_~/~S_" ~ ~ ~ ~ ~ ~ (D):ADJ 
SONT (D):VTE 
INQUIETS (D):ADJ 
DE (D):PREP 
LA (D):ARTD 
iS~igi6iq ........ (D):SUBS 
DE (D):PR.EP 
RALENTER (D):VP 
L (D):V 
ECONOMIE (D): SUB S 
..................... • (D):RECS 
LES (D):ARTD 
MOKALISTES (D):SUSU 
SCANDALISES (D):ADJ 
: .................... (D):RIF 
GROSSES (D):ADJA 
Bi~.TES ............ (D):SUBS 
BIEN (D) ADVI 
EN (D):PREA 
PEINE (D):SUBS 
DE (D) :PREP 
RESOUDRE (D):V • 
..................... LES (D):ARTD 
...................... PROBLEMES (D) :SUBS 
DE (D):PREP 
i, ~ .................. (D):AR.TD 
HOMME (D):SUBS 
: ................... (D):R.GSU 
DItLIGENT (D):VT 
LE (D):ARTD 
/~(5~,~E .......... (D):SUBS 
• (D):R.ECS 
COMMENTAIRE 6. 
Analyse par d~faut. 
Dans les pages suivantes, on pr~sente un essai d'analyse par d~faut, ef- 
fectu~e sur un texte de 1000 roots, A l'aide des corr61ations binaires. 
Les mots des lignes 2 et 4 sont analys& par d~faut et les roots des lignes 
21, 22, 25, 30, sont analys& par d~faut. On peur le constater en v~rifiant 
dans la liste de comparaison, les roots qui figurent ou non dans le dictionnaire. 
Le mot MOTEUR ~ la ligne 22 est analys6 par d~faut. Mais comme le 
hombre de valeurs trouv&s est sup&ieur ?t 20, on a consid&d que l'analyse 
par d~faut pr&entait moins d'int&& et on a mis des points de suspension. 
1 LE : AKTD 
...................... 
2 CALCULATEUR : SUBS SUSU 
3 i~EU;~ ................ :VT 
4 'r~-(~-OX/J~R ........ i ADVL ADVP ADVQ RECS RENP RESP RIF V VIPO 
5 DANS : PREP 
6 LE : ARTD 
7 PROGRAMME SUSU 
...................... 
8 D' : PREA 
9 ib~s~KL~/~t~6iqs: SUBS 
10 CIqXR.Gi~ ............ :ADJP 
..................... 
11 EN : *****INCOMPATIBILITE**~** 
....................... 
PREP 
PtLEA 
12 MEMOIRE : SUBS 
...................... 
13 LA ARTD 
...................... 
14 MANIERE : SUBS 
15 1901~'i" ............. i PREC 
18 \]3~1 .................. i PREA PREP 
19 S OiqlT ............... :VTE 
..................... 
20 LE : ARTD 
21 v~.16.i;r~-i~}~ ........ : ADJA ADPR ADVI ADVS SUBS SUJT SUSU 
22 /~¢i(STf.UIL .......... - ADJ ADJP ADPR ADVI ADVL ADVP NPRO PROG RECS REMP 
RESP RIF SUBS SUSU V VANT VIPF VIPO VPE etc. 
23 : RECS 
...................... 
24 UNE ARTI 
....................... 
25 QUESTION : ADJA ADVI SUBS SUSU 
26 NOUVELLE : ADJ ADJP 
...................... 
27 N' NE 
....................... 
28 Y : PROV 
29 SERA : VTE 
30 TP,.AI'r\]~\]~ ........... : ADJ ADVI ADVL ADVP PREP PROG RECS SUBS V VAUX VPE VTE 
....................... VTI VTSU VVT 
31 QUE : ADVP PREC RECC RECS 
32 SI : ILECS 

