GIACOMO FERRARI 
DICTIONNAIP,.E AUTOMATIQUE 
ET DICTIONNAIRE-MACHINE: UNE HYPOTI-~SE 
1. Pendant quatre ans le groupe de recherche linguistique du 
CNUCE a produit un dictionnaire automatique de la langue italienne, 
c'est-fi-dire tree liste de toutes les formes, lemmatis~es et enregistr~es 
sur m~moire p6riphdrique. 
Pour cette production on a employS: 
a) une liste d'entr~es d6crites soit sous raspect lexical, soit sous 
l'aspect .morphologique; 
b) des programmes de flexion portant soit sur des r~gles g~n~- 
tales, soit sur l'interrogation de codes morphologiques particuliers de 
l'entr6e. 
Etant donnd qu'un tel dictionnaire a 6t6 projet6 pour &re employ~ 
dans les procedures de lemmatisation automatique, ~ l'heure actuelle 
il est utilisable, bien qu'il puisse &re consid6r6 termin6 ou non termin6 
suivant le degr6 de precision de la lemmatisation que l'on veut obtenir 
et le degr6 de sophistication des procddures que l'on veut employer 
pour lemmatiser. 
Mais on s'attend aussi ~ ce qu'il soit employ~ comme partie d'une ma- 
chine pour l'analyse linguistique d'un texte. Cet emploi demande une 
predisposition du dictionnaire ~l fournir non seulement des donn6es sur 
l'accord morphologique dans la phrase, mais aussi des traits de s61ec- 
tion qui permettent de r~duire le hombre trop dlev6 de s~quences pos- 
sibles ~l un hombre plus proche de celui des phrases grammaticales de 
fa~on h nous mettre en condition d'exercer un choix plus fin entre 
arbres alternatifs. 
2. I1 est dvident que le projet n'est qu'un perfectionnement des 
deux moyens d6fii employds dans la production de notre dictionnaire. 
D'un c6t~ on devra gdndraliser les programmes de flexion en en faisant 
une structure capable d'analyser. Ce n'est pas notre intdr~t ici de parler 
de cette branche du projet; il suffit de dire que la gdn6ralisation des 
17 
258 GIAEOMO FERI~RI 
r~gles morphologiques entra~me un processus de precision aussi des 
codes morphologiques attaches aux entr~es. 
Le projet que nous sommes en train de d6velopper est, au contraire, 
la recherche et l'assignation des traits s~lectifs et des codes syntaxico- 
s~mantiques des entr~es ce qui n'est qu'un raffmement des codes lexi- 
caux que nous avons employ6s dans la phase pr~c~dente. 
Nous justifierons ensuite notre confusion entre traits lexicaux et 
traits syntaxiques, mais je ¢oudrais souligner, avant de commencer, 
l'importance de deux autres probl~mes: 
a) l'6conomie d'espace, que nous devrons r6aliser non seulement 
avec des moyens techniques, mais aussi en essayant de concentrer et de 
distribuer l'information d'une fa~on plus simplement utilisable; 
b) l'organisation des entr6es qui devra refl6ter n~cessairement la 
disposition de l'information pour r6aliser le principe d'~conomie. 
3. Pour nous mettre au travail il nous faut partir d'une s~rie d'ob- 
servations et de postulats. 
3.1. La premiere observation est que nous sommes partis d'un 
travail lexicographique et que nous sommes oblig6s de continuer ~ tra- 
vailler sur le lexique. Nous aurions eu une autre solution: nous aurions 
pfi essayer notre dictionnaire, mot apr~s mot, dans de petites phrases 
correspondant k une syntaxe tr~s r6duite et simple, en classant chaque 
mot suivant son fonctionnement dans le contexte. Mais l'extension du 
dictionnaire rend presque infini le nombre des combinaisons. D'autre 
part, en travaiUant avec une petite syntaxe invent6e dans ce but, on a 
la certitude que notre classement aura les limites de la syntaxe m~me. 
En effet, un dictionnaire exhaustif ne peut ~tre exhaustivement trait6 
et class6 si ce n'est au moyen d'une syntaxe exhaustive. 
On a pens6, donc, de renverser l'ordre des choses et de continuer 
~, d6crire le vocabulaire en cherchant, parall~lement, les r~gles synta- 
xiques capables de traiter les cat6gories que nous trouvons. 
3.2. Pour justifier cette position, nous acceptons le postulat que 
chaque article d'un dictionnaire quelconque ne soit que la neutralisa- 
tion d'un ou plusieurs types de contextes de l'entr6e. 
Suivant ce postulat il sera possible de d6gager une s6rie de traits 
syntaxiques par la simple interpr6tation d'un article de notre diction- 
naire de base. Notre confusion entre donn6es lexicales et donn6es syn- 
taxiques se justifie par le fait clue nous employons un article comme 
DICTIONNAIRE AUTOMATIQUE ET DICTIONNAIRE-MACHINE 259 
image d'tme s&ie de contextes et la s6rie de contextes comme image 
d'une structure syntaxique. 
3.3. Ce principe entralne un autre postulat. La d6finition que le 
dictionnaire attache ~t chaque entr6e, d'un c6t6 a la fonction de nous 
faire comprendre le signifi6 d'un mot, de l'autre repr6sente effectivement 
les traits contextuels que nous cherchons. Elle appartient, donc, au 
langage, puisqu'elle nous renseigne sur tree certaine r&lit6, parfois 
concr&e, parfois linguistique, et ~ un m&alangage, puisque chaque 
~l~ment, ou certains ~ldments les plus significatifs, peut &re consid~r~ 
comme le symbole d'tm certain trait. 
Si, par ex., 
BEA UTI~ est d6fini ~ Qualit6 de ce qui est beau ~), nous sommes 
renseign6s sur ce qu'est la ~, beaut~ ,), mais nous savons aussi que le mot 
BEAUT~ appartient ~ la classe qualit~ et aura une certaine s&ie de 
compatibilit6s d6finies par cette classe. 
De mSme, si 
CHIEN est r~ellement un ~, Mammif~re domestique des Car- 
nivores )~ il est vrai aussi que le mot CHIEN appartient ~t la classe lin- 
guistique des mammif~res et, donc, aura, parmi la classe des animaux, 
les compatibilit6s caract6ristiques des mammif~res, tel que, p. ex., la 
famille des verbes qui comprend ACCOUCHER, POULINER, 
VELER, METTRE BAS etc. 
4. Evidemment, sur cette route se posent d~j~ des difficult~s. La 
premiere est que, ayant choisi un dictionnaire de base, il faut en 
d&oder le m&alangage et distinguer les diff~rents niveaux d'analyse 
lexicale et syntaxique. En effet, suivant notre experience, nous savons 
que les explications peuvent avoir la forme d'un synonyme, d'une des- 
cription ou simplement d'une relation syntaxique par rapport ~t une 
entree-base. La question se pose, donc, de savoir s'il s'agit de substances 
diff~rentes, de diff&ents niveaux d'analyse ou, plus simplement, de 
moyens cliff, rents arbitrairement employ& pour d~crire la m~me chose. 
Or, si nous acceptons le point de vue optimiste qu'un dictionnaire, 
en tant qu'il repr6sente une certaine tradition lexicographique, emploie 
des moyens assez r~guliers, formalis& et, par consequent, d&hiffra- 
bles et immddiatement employables comme symbole univoque d'un 
m&alangage unitaire, les difficultds seront r6solues par tm processus 
de d&odage, interpr&ation et traduction en symboles mdcaniquement 
utilisables. 
260 GIACOMO FERRARI 
5. Pratiquement le projet se ddveloppe en trois phases dont nous 
sommes en train d'accomplir la premiere: 
a) Nous transcrivons, en correspondance de chaque entr6e, lad& 
finition, ou les d6finitions, qui lui sont attach6es par le dictionnaire, et 
toutes les autres indications qui peuvent avoir une fonction de s61ec- 
tion pr6alable, telles que l'indication de langage sp6cialis6, de proc6d6 
de d~placement s~mantique etc. 
La transcription de la d6finition doit ~tre faite suivant certaines 
r~gles qui visent ~t la r6duire ~t l'essentiel en en mettant en ~vidence les 
termes les plus significatifs. I1 s'agit d'une significativit~ par rapport 
l'article m~me et non pas par rapport ~ l'hypoth~se g6n6rale. En effet, 
on a invent6 des r~gles de lecture et d'interpr&ation formelle de l'ar- 
ticle, justement pour emp~cher toute intervention subjective. Surtout 
l'article doit ~tte lu simplement comme un article de dictionnaire 
sans aucune conscience de la double fonction dont nous avons parl6 
plus haut. 
D'autre part, on emploie trois types de formats de transcription, 
suivant les trois types de d6finition grossi~rement d~crits. 
b) Successivement on se propose d'essayer des groupements gros- 
siers de mots suivant leurs explications, ou, pour se rattacher ~ l'hypo- 
th~se, suivant leurs traits syntaxico-s6mantiques. Le syst~me plus g6- 
n6ral devrait consister ~ trier une premiere fois les ddfinitions, de fa~on 
que l'on puisse observer, d'un c6td, d'dventuelles d~viations du m~ta- 
langage fix6 par le dictionnaire de base, et, de l'autre, les 616ments cons- 
tants de la d6finition. 
A partir de ce moment on pourra commencer ~ faire un travail 
originel, parce que seulement ici on aura dficod~ le m6talangage du 
dictionnaire et on pourra essayer d'6conomiser les ~l~ments constants 
des dffinitions, en commengant k les utiliser r~eUement comme des 
traits s~lectifs par rapport k un contexte. 
Avant de continuer il faut souligner que, bien qu'ici on ne parle 
que d'une mdthode g6n6rale, on est conscient qu'il sera n&essaire d'abor- 
der le travail avec plusieurs syst~mes d'analyse. En effet, l'emploi des 
diff6reuts formats de transcription a justement la fonction de faciliter 
une premiere division du travail suivant une certaine hypoth~se que 
nous avons dnonc6. De m~me, je n'ai pas parle, jusqu'ici, de classement 
ou d'encodage parce que notre exp6rience nous rend stirs que seule- 
ment le premier tri nous donnera les connaissances suftisantes pour 
projeter les proc6d6s corrects. 
DICTIONNAIRE AUTOMATIQUE ET DICTIONNAIRE-MACHINE 261 
Aux lexicographes je rappelle l'importance mSme de la premiere 
partie de ce projet qui nous lib~re de l'esclavage de la consultation du 
dictionnaire pour toute op6ration de lemmatisation. 
c) Nous passons donc ~l la troisi~me phase qui est compl~tement 
hypoth&ique. Nous sommes stirs, du moins, que nous aurons la pos- 
sibilit6 de traduire certaines sequences en codes gEnEraux appartenants 
un mEtalangage plus abstrait que le m6talangage que nous avons re~u 
du dictionnaire. Nous savons, d'autre part, que cette classification n'est 
pas sul°fisante pour la cr&tion d'un instrument d'analyse assez puissant 
pour &re exhaustif. Pour citer tin exemple, si la definition de BEAUTt~ 
est ~ QualitE de ce qui est beau ~>, je peux lui attacher le code indiquant 
qu'il s'agit d'un abstrait, ce qui constitue d6j~i une sdlection, mais ne 
me renseigne pas sur le fair qu'il s'agit d'une qualitY, par opposition, 
p.ex., ~ sentiment, vertu etc. 
L'objection la plus facile serait pourquoi ne pas attacher un code 
g6n~ral indiquant abstrait et un code plus particulier qui serait la traduc- 
tion immddiate du premier terme de la d~finition, qualitd, sentiment, 
ou vertu. Ceci est sans doute vrai, mais ne r6sout le probl~me qu'~ 
moiti& I1 existe, en fair, tree large quantit~ de catdgories repr6sent6es par 
un ou deux roots dont la traduction en codes serait peu ~conomique. 
Mais si nous revenons tin instant ~ notre postulat suivant lequel 
nous traitons un mEtalangage qui n'est que l'emploi mEtalinguistic/ue 
du langage, nous voyons que nous n'avons pas besoin de tellement de 
codes. I1 sera suflis,~nt de renvoyer une classe de roots au mot du diction- 
naire qui constitue le premier 6IEment de la definition. Le mSme pro- 
cessus peut 8tre appliqud aux dlEments successifs, s'ils apparaissent 
suffisamment significatifs. 
A la fin de ce travail on aura renferm~ le vocabulaire dans un r& 
seau de branchements constitu~ par: 
a) une sErie de categories g6n~rales qui repr6sentent tree pre- 
miere division en branches du vocabulaire; 
b) des branchements exprimant des rapports hi6rarchiques en- 
tre les roots du vocabulaire; 
c) des branchements exprimant des rapports d'6quivalence en- 
tre certains roots. 
6. On arrive, donc, ~t concevoir le dictionnaire comme tin arbre 
dont les premiers noeuds sont des cat6gories g6nErales et les noeuds 
inf6rieurs sont les mots du vocabulaire hi6rarchiquement ranges. 
262 g~^COMO r~aaAaI 
La caract6ristique fondamentale de cet arbre est que chaque noeud 
peut ~tre constitu6 d'un ou plusieurs roots, de re@me qu'un mot peut 
repr6senter un ou plusieurs noeuds. 
I1 reste encore un point ~t 6claircir, l'emploi de cet arbre, 6tant 
donn6 surtout qu'il s'agira de plusieurs arbres, du moins un arbre 
pour la pattie nominale du discours et un arbre pour les verbes. 
I1 est 6vident qu'en phase de recherche syntaxique il sera assez facile 
de descendre les arbres et v6rifier une r~gle sur deux ou plusieurs bran- 
ches que nous savons d6j~t compatibles entre elles. En termes plus pra- 
tiques, il sera facile de prendre tousles noeuds 6quivalents des arbres 
produits en traitant par une r~gle seulement ce qui se trouve au dessous 
de ces noeuds. 
Mais le contraire est vrai aussi: ~tant donn6 une phrase, une syn- 
taxe et une table de compatibilit~ entre les sous-branches des arbres, 
on pourra limiter le dictionnaire pour l'analyse de la phrase aux sous- 
branches compatibles avec la sous-branche du premier mot, de faqon 
que si dans la recherche m6canique un mot manque, la phrase n'aura 
aucun sens, ou le mot sera employ6 dans tm signifi6 que nous ne 
connaissons pas. 
7. Seulement dans ce sens nous r~aliserons l'~conomie d'espace 
et d'information dont nous avons parl6. Nous aurons la possibilit6 de 
travailler sur des petites tranches de vocabulaire ~t la fois. D'autre part, 
si, une fois l'analyse termin~e, on a besoin d'en classer les 616ments 
lexicaux, on n'aura qu'~t remonter les arbres en en m6morisant les 
noeuds, pour avoir le classement et une sorte d'explication. 
