Une troisi~me version du " Dicautom " . 
J.A. Bachrach et L. Hirschberg. 
Notre dictionnaire automatique fournit la traduction des 
termes d'un texte, comment~e par des exemples, ~ des ~quipes de 
traducteurs et d'interpr~tes qui travaillent sur les quatre langues 
de la Communaut~ Europ~enne et sur l'anglais. 
Ii se diff~rencie d'un dictionnaire, fait de papier et de carton, 
essentiellement par les moyens automatiques dont il dispose pour le 
tri, le stockage, la mise ~ jour, la consultation ou l'impression. 
Mais s'il est plus riche en exemples et manipul~ en ordinateur, il 
a ~t~ r~uni par des lexicologues, des terminologues et des traduc- 
teurs, comme un dictionnaire ordinaire. 
L'~quipe responsable des versions successives se composait des mem- 
bres du Bureau de Terminologie de la Haute Autorit~ de la Ceca, 
J.A. Bachrach, R. Denti, P. Fleurbaay, J. Goetschaelckx, H. Lenoch, 
C. Noss, R. Weisgerber, J. Wilson, et du Centre de Linguistique 
Automatique Appliqu~e de l'Universit~ fibre de Bruxelles, J. Blois, 
Fr. Decresy, L. Delhaye, R. Dorrepaal-Van Beek, L. Hirschberg, N. 
Hollaar, J. Mommens, E. Morlet. 
La description pr~sent~e ici concerne une troisi~me version du sys- 
t~me, fonctionnant sur une IBM 360/40, achev~e en d~cembre 1966 et 
mise au point au d~part de la langue allemande. La premiere version 
sur IBM 1401 et au d~part du franqais, date de 1962 (" La Traduc- 
tion Automatique " - IV-3-1963 ). La deuxi~me a ~t~ pr~sent~e 
Venise par J.A. Bachrach au " S~minaire International de I'OTAN sur 
la Documentation Automatique " (juillet 1963) et publi~e depuis en 
divers endroits. Elle fonctionne sur IBM 1410, au d~part du fran- 
qais et du n~erlandais. Ainsi qu'il ressort du rapport " Language 
and Machine ", publi~ fin 1966 par la National Academy of Sciences, . 
Washington, il n'existe qu'une seule formule qui se rapproche de la 
nStre, ~ savoir celle adopt~e par le service de traduction de l'ar- 
m~e allemande ~ Mannheim. 
Au cours de cette nouvelle experience nous avons pr~cis~ les d~fi- 
nitions des concepts linguistiques, simplifi~ et syst~matis~ les 
codages manuels. Nous avons r~analys~ et transform~ le processus 
et r~organis~ les fichiers. Enfin, en tenant compte des possibili- 
t~s nouvelles de la machine, d'une m~moire de 256K, et en fixant 
les modes d'exploitation des programmes, nous en aVons consid~ra- 
blement am~lior~ le rendement. 
Avant d'entrer dans le d~tail de la description du syst~me, 
il est bon de donner un aperqu de son utilisation et des motivations 
qu i ont guid~ sa conception. 
. I . 
Notre dictionnaire comporte un mot ou une locution de la langue 
source, sa ou ses traductions dans les langues cibles, et pour 
chaque unit~ des exemples de contextes et leurs traductions. Ce 
qui est valable pour la langue g~n~rale, l'est ~galement pour la 
langue technique ; la traduction d'un terme ne d~pend pas seule- 
men, du domaine, de la mati~re trait~e, de l'~poque o~ il a ~t~ 
employS, mais aussi des contextes dans lesquelS il se place. 
Toutes ces donn~es sont r~unies darts le dictionnaire. 
Quelle sera la source de nos exemples ? Les terminologues puisent 
de preference leurs informations dans des documents originaux: 
manuels, rapports, catalogues, brochures scientifiques ou publici- 
taires et surtout dans les revues sp~cialis~es. L'emploi de tex- 
tes traduits en plusieurs langues serait plus simple, mais risque- 
rait d'entrainer la confection d'un langage artificiel et de per- ~ 
tuer des erreurs. Ii importe de se servir dans chaque langue 
de ia terminologie propre au secteur en question dans le pays 
d'origine de cette langue. 
Le terminologue re~oit du traducteur des questions, sous forme de 
phrases-demandes ou de fragments de phrases dans lesquelles le 
traducteur a senti des pi~ges de traduCtion. Du stock de phrases- 
exemples que nous avons accumul~es dans notre fichier - qui s'~l~- 
ve ~ quelque six mille unit~s aujourd'hui, mais peut arriver 
cent mille - l"ordinateur doit extraire les exemples de traduction 
les "plus proches possibles" de ceux de la demande• La pr6sence 
-des contextes dans les r~ponses permet au traducteur de choisir 
lui-mSme la traduction des mots, en contrSlant le bien-fond~ des 
traductions propos~es par les exemples, relativement aux cas qui 
l'occupent• S'il y a doute, plusieurs r6ponses sortiront, parmi 
lesquelles le traducteur ~liminera lui-mgme les r~ponses inad~- 
quates° (Illustration I) 
Une autre condition importante pour l'utilisateur est que les 
questions puissent ~tre formul~es librement. En aucun cas, la 
formulation de la question ne n6cessite une connaissance mgme 
partielle de la r~ponses: tout l'effort de construction du syst~- 
me incombe au r6alisateur. L'utilisateur souligne simplement un 
fragment de quelques mots. Pour que ce fragment de texte ~ tra- 
duire puisse 8tre d~coup~ sans precautions particuli~rese les ter- 
minologues doivent veiller ~ op~rer un d~coupage judicieux pour 
obtenir les phrases-exemples• 
L'absence de tout codage au moment de la demande, implique un co- 
dage effectu~ lors de la construction du dictionnaire, qui donne 
des lois d'identification des formesdu texte courant avec les 
unit~s du lexique° Une telle structure se justifie par le fait 
que le programme est con~u pour consulter, fr6quemment et.en vue 
d'une tr~s grande quantit~ de textes ~ traduire, un dictionnaire 
de phrases relativement limit~, de sorte que le codage ~ l'entr~e 
est le plus ~conomique. (Illustration II) 
• '2 . 
Illustration I 
demande 0000000012 
eine § traenke dieser art besteht aus einem robusten 
verzinkten § stahlblechgehaeuse 
r@ponses 
traenke als automatische traenken haben sich tropftraenken 
und rinnentraenken bewaehrt 
fra gli abbeveratoi automatici si sono affermati 
quelli a goccia e quelli a livello costante 
bestehen aus 
blech 
die verteilerkoepfe der melkzeuge bestehen aus 
gedrueckten nichtrostenden stahlblechteilen 
i distributori delle unita di mungitura sono compos- 
£i di pezzi a rilievo in lamiera di acciaio inossi- 
dabile 
bestehen aus luftheizungsoefen bestehen aus einem inneren ofen- 
stahl 
blech 
stahl 
blech 
verzinken 
mantel aus stahl und einem aeusseren stahlblechman- 
tel 
le stufe ad aria calda sono costituite di un rives- 
timento del forno in acciaio e di un rivestimento 
metallico esterno 
selbsttragende pfannen aus verzinktem stahlblech 
elementi autoportanti in lamiera d acciaio zincata 
blech 
gehaeuse 
ventilatoren fuer unterdachtrocknung werden zum 
ortsfesten einbau in stahlblech~ehaeuse montiert 
geliefert 
i ventilatori per 1 essiccamento dell erba in fieni- 
le sono disponibili con involucri in lamiera d acci- 
aio per montaggio stabile nel fienile 
demande 00000000~3 
hochfoerderrinne mit schubstangen und § sperrechen 
pas de r~ponse. 
• 3 . 
Trois modes de consultation paraissent ad6quats selon le 
rythme et le volume des questions. 
" En direct " tout d'ab0rd, le programme se trouve en permanence 
tout entier dans la machine, munie de tousles fichiers, et si- 
~multan6ment d'ailleurs avec des programmes appe16s pour~d"autres 
travaux. Le demandeur poss~de sur sa table un clavier d'appel 
qu'il actionne ~ tout moment et mgme pour une seule question. 
La r6ponse appara~t sur un 6cran de t61~vision ouse dactyl.gra- 
phic sur une machine ~ ~crire. Nous arriverons ~ ce mode de fonc- 
tionnement lorsque notre ordinateur sera organis6 en multiprogram- 
mation et lorsque nous poss~derons des unit6s de stockage perma- 
nent pour nos dictionnaires. 
I L'organisation actuelle permet de travailler " en diff~r~ "~ 
c'est-~-dire de r6unir jusqu'~ mille phrases demand6es en une 
journ~e I les fair, perforer par une dactyl, sur des cartes .IBM 
et de distribuer les r~ponses quelques heures plus tard. 
Mais une organisation bien plus efficace, lorsqu'il s'agit de 
traduire syst~matiquement de grands volumes de text,s, pourra "~ 
8tre mise en oeuvre bientSt, I1 exist, d~j~ en Europe des impri- 
meries quiFont corriger et justifier automatiquement en ordinateur 
les text,s ~'imprimere Au moment o~ l'imprimeur passe les text,s' 
de la band, linotype en ordinateur nous pouvons les introduire et 
les conserver sur band,s magn6tiques sans avoir ~ les perforer. 
D~s lots sices text,s sont destin6s ~ gtre traduits, nous pouvons 
les passer sans aucun travail humain suppl6men~aire sur notre i 
programme de consultation de dictionnaire. A la sortie, nous 
obtiendrons, en plus et ind~penda~ent du text, imprim6, une pr6- 
paration du volume entier, qui nous informera, phrase par phrase, 
sur les difficult6s de traduction vers une ouplusieurs langues 
et la mani~re de les surmonter• 
Mais avant que nous ne soyons en possession de cet'immense 
fichier et d'une r6ponse instantan~e ~ routes nos questions, sur 
un ~cran de t~l~vision les terminologues doivent r6pondre aux • 
besoins journaliers par des moyens plus classiques• En aucun cas 
leurs obligations courantes ne peuvent 8tre diminu6es ni ralenties 
sous pretext, de construction pour le futur• Parailleurs une 
r~alisation ~ longue ~ch6ance ne peut 8tre effectu6e s6rieusement 
en marge de la connaissance des besoins, pratiques actuels. C'est 
pourquoi nous nous servons de leur propre fichier, pour notre 
dictionnaire automatique, mais aussi pour l'~dition de glossaires 
phras~ologiques ~ 1'aide d'un programme qui ~vite toutes les mani- 
pulations ordinaires de la typographic• 
Ce que le terminologue introduit-dans la machine, pour 
construire le dictionnaire c'est le contenu d'une fiche, c'est-~- 
dire un fragment de text, plus ou moins long (jusqu'~ vingt mots 
environ) ainsi qu'un code-mati~re etune r6f6rence bibliographi-, 
que, 
• 4 • . 
Illustration II 
TIPV 
TIPV 
TIPV 
T3PF 
TIPM 
TIPV 
T1PV 
T3PI 
TIPM 
T9 
T9 
T9 
T9 
T3 PE 
T3 PE 
TIPV 
TIPV 
T3PF 
T1 PV 
TIPM 
TIPV 
T8 
T8 
T8 
T3 PF 
TI PM 
T3XF 
T3XF 
T3XF 
T3XF 
T1 PV 
SOLIVE 
SOLLICITATION 
SOLLIC ITATION 
SOLLICITE 
SONDAGE 
SORTE 
SOUDABILITE 
SOUDABLE 
SOUDAGE 
SOUDER 
SOUDER 
SOUDER 
SOUDER 
SOUDEUR 
SOUDEUR 
SOUDURE 
SOUDURE 
SOUFFLE 
SOUFFLERIE_ 
SOUFRE 
SOURCE 
SOUS 
SOUS 
SOUS 
SOUTERRAIN 
SOUTIEN 
SPATIAL 
SPECIAL 
SPECIAL 
SPECIAL 
SPECIFICATION 
I.i 
I 
I_ 
SOLIVES-HOURDI S 
SOLLIC ITATION 
SOLLIC ITATIONS 
SOLLICITES 
SONDAGE 
SORTE 
SOUDABILITE 
SOUDABLE 
SOUDAGE 
SOUDE 
SOUDEE 
SOUDER 
SOUDES 
SOUDEUR 
SOUDEUSE 
SOUDURE 
SOUDURES 
SOUFFLEE 
SOUFFLERIE 
SOUFRE 
SOURCE 
SOUS-FACE 
SOUS-GROUPES 
SOUS-SOL 
SOUTERRAINES 
SOUTIEN 
SPATIALE 
SPECIAL 
SPECIALE 
S PEC IAUX 
SPECIFICATION 
• 5 ° 
Ce fragment contient une difficult~ de traduction et le contexte 
qui conditionne l'emploi de cette tournure particuli~re. Si 
nous avons en fran~ais+ " PONT A POUTRES EN TREILLIS " , le mSme 
~nonc~ est repris dans cinq ou six langues sur la mSme fiche. 
Ii servira de"phrase-exemple" (au singulier) qui ira dans le fi- 
chier° 
F PONT A POUTRES EN TREILLIS 
D FACHWE RKBALKE NBRUECKE 
I PONTE A TRAVI A TRALICCIO 
N VAKWERKLIGGERBRUG 
E TRUSSED GIRDER BRIDGE 
(Illustration III) 
Le premier travail de la machine est effectu~ par un programme du 
genre "KWIC" qui attache cette fiche toute enti~re, avec les ~non- 
c6s, dans toutes les langues~ en autant d'endroits diff~rents qu' 
elle contient de mots: pont, poutres, treillis, vakwerkliggerbrug, 
bridge etc+ En chaque endroit, la fiche va rejoindre d'autres 
fiches con~ues comme elle. (Illustration IV) 
En somme, le mSme stock de phrases-exemples, existant actuelle- 
ment en cinq langues# est utilis~ pour cinq dictionnaires, un dic- 
tionnaire par langue de d~part. Toutefois, le programme est pr~- 
vu pour six langueso II s'ensuit que cinq r6ponses peuvent gtre 
donn~es ~ partir d'une langue, vers cinq langues diff~renteso 
Cela ~quivaut finalement ~ trente dictionnaires bilingues. 
Insistons maintenant sur le fait que les listes-diction- 
naires finales contiennent des "unit~s lexicales" et non pas des 
mots, car ces unit~s sont parfois plus longues, comme "plaque de 
facade" ou "sauerstoffgeblasenes risen", tenus pour des unit~s. 
Parfois ellessont plus courteso Ainsi il faut trois unit~s 
lexicales "Rost" "Stab" et "risen" pour reconstituer automatique- 
ment c'est-~-dire reconnaftre le mot "Roststabeisen" dans le tex- 
te d'une demande. 
C'est le constructeur qui choisit l'unit6 lexicale et marque pour 
chacune d'elles les phrases du stock qui la concernent. Ii em- 
ploie des crit~res d'observation bas~s sur les phrases-exemples 
et leurs traductiOns° 
Lorsqu'un mot se traduit de plusieurs mani~res diff~rentes, notre 
syst~me donne au lexicologue le choix entre deux solutions. Ou 
bien il cr~e pour le mot plusieurs rubriques, chaque rubrique 
contenant d'autres phrases-exemples, et nous disons qu'il s'agit 
d'autant d' "homonymes" diff~rents de ce mot. Ainsi en allemand 
"Raum" se traduira dans de nombreux contextes par "espace", dans 
d'autres par "chambre" ou "local" et enfin nous lui avons m~me 
trouv~ la traduction "surface"° Nous croons des "homonymes"t 
lorsque le hombre de traductions n'est pas trop grand, et les 
contextes o~ ces traductions s'imposent sont nombreux. 
Au contraire, nous avons trouv~ pour "Lager" plusieurs traductions 
tr~s particuli~res qui ne convenaient chacune qu'~ un contexte 
bien d~fini. Pour d~finir les cas o~ il fallait choisir ces tra- 
ductions, le mieux ~tait de fairedes"grouPes locutionnels" de 
Ces contextes, c'est-~-dire des unit~s ind~pendantes compos~es de 
plusieurs autres unit~s. Notre lexique allemand contient de cette 
mani~re "Kugellager" (roulement ~ bille), "Gleitlager" (appui 
glissant), "Obstlagerhaus" (d~pSt ou entrepStde fruits), "Lager- 
behaelter" (cellule de stockage)° 
Illustration IV 
PONT 
PONT 
PARAPETS DE ROUTES ET DE PONTS 
D STRASSEN- UND BRUECKENGELAENDER 
I PARAPETTI STRADALI E DI PONTI 
N BORSTWERINGEN VOOR WEGEN EN. BRUGGEN 
E ROAD AND BRIDGE RAILINGS 
PONT A POUTRES EN TREILLIS ET ARTICULATIONS INTERMEDIAIRES 
D FACHWERKBALKENBRUECKE MIT ZwISCHENGELENKEN 
I PONTE A TRAVI A TRALICCIO .ARTICOLAZIONI INTERMEDIE 
N VAKWERKLIGGERBRUGGEN MET SCHARNIERENDE DIAGONALEN 
E LATTICE GIRDER BRIDGES j WITH INTERMEDIATE JOINTS 
PONT PONT_ A POUTRES EN TREILLIS 
D FACHWE RKBALKE NBRUEC KE 
I PONTE A TRAVI A TRALICCIO ~ 
N VAKWERKLIGGERBRUG 
E TRUSSED GIRDER BRIDGE 
PONT PONT BASCULANT 
D KLAPPBRUECKE 
I PONTE LEVATOIO.,PONTE RIBALTABILE 
N KLAPBRUG., OPHAALBRUG° , BASCULEBRUG 
E BASCULE BRIDGE 
PONT PONT CANTILEVER EN TREILLIS 
D FACHWE RK-GERBERTRAEGER-BRUECKE 
I PONTE A SBALZO A TRALICCIO 
" N VAKWERK-GERBERLIGGERBRUG 
E CANTILEVER TRUSS BRIDGE 
. 7. 
Les "groupes locutionnels", comme les autres unit~s lexicales, 
poss~dent dans notre dictionnaire des phrases-exemples qui leur sont 
attach~es. Mais il s'agit de reconna~tre de telles unit~s dans le 
texte d'une demande. 
C'est donc par une analyse morphologique au sens le plus 
large de ce terme, allant de la reconnaissance d'une forme et de sa 
d~coupe ~ la d~couverte d'un groupement de plusieurs formes dans une 
phrase, que commencent les programmes de consultation automatique de 
nos dictionnaires. Ils comportent deux :phases importantes en dehors 
de routines de tri et de mises en page, la deuxi~me grande ~tape 
~tant le choix des meilleures phrases-exemples ~ donner en r~ponse ~i 
une certaine demande, Ce choix est fait parmi les phrases attach~es 
aux rubriques du dictionnaire qui viennent d'etre reconnues par l'ana- 
lyse morphologiqueo J 
Les phrases-r~ponses les meilleures sont choisies par programme. 
Nous avons ~labor~ dans ce but des r~gles pr~cises et un calcul assez 
compliqu~. Mais en un mot il est permis de dire que ce sont les 
phrases parmi celles ~u stock qui ont en elles chacune le plus grand 
nombre possible d'unit~s lexicales reconnues dans une demande par la 
machine, 
Le dictionnaire se compose de quatre fichiers ind~pendants, 
ce qui acc~IAre la consultation automatique et facilite la correction 
~ventuelle de ces fichiers. 
Le premier est un dictionnaire alphab~tique de mots ou de 
radicaux, accompagn~s de leurs codes morphologiques et de deux num~- 
ros de renvoi, le num~ro de la liste des groupes locutionnels aux- 
quels ils appartiennent et le num~ro de la liste des phrases-exemples 
dans lesquelles ils apparaissent comme mots simples. L'une des deux 
listes peut d'ailleurs ne pas exister. 
Ce premier fichier est suffisamment d~pouill~ pour qu'il puisse 8tre 
charg~ en m~moire rapide au moment de la consultation du dictionnaire. 
Une table d'adresses constitute par les deux premieres lettres des 
mots se forme au m~me moment dans cett@ m~moire. Cela permet une 
analyse morphologique tr~s rapide, san~ m~me trier alphab~tiquement 
les mots d'une demande. (Illustration V) 
Toutes les hypothAses de d~coupes sbnt faites pour chaque mot, de 
gauche ~ droite. Le programme tient compte aussi de l'existence 
possible, de d~sinences finales ~ la fin d'une s~quence de lettres. 
De plus il suit des r~gles d'acception et de rejet des diverses d~- 
coupes, dont nous ne donnerons qu'un exemple d'application. Ainsi 
on voit dans l'illustration V, que " SERIENIBAUTEN " a ~t~ d~coup~e 
en deux mQts, tandis que ~a d~coupe "BAUIKASTENISYSTEM'~ a ~t~ reje- 
t~e (un signe "moins" se trouve devant le sigle DE) au profit de la 
d~coupe "BAUKASTENISYSTEM". Ii est ~vident qu'il refuse aussi route 
hypoth~se qui ne recouvre pas convenablement une s~quence de lettres 
sans blancs. 
. 8 . 
Illustration V 
MGT MCT VORGEFERTIGTE 
DE F VOR 
E GEFERT IGTE MOT STANDARDBAUTEN 
DE " F STANCARD 
F BAUTEN DE 
F STANDARD F BAUTEN 
DE 
F STANDARD F-BAUTEN 
MCT UND MOT SERIENBAUTEN 
DE F SERIEN 
F BAUTEN MOT IM 
DE F IM 
MOT BAUKASTENSYSTEM -DE 
F BAU F KASTEN 
F SYSTEM -DE 
F BAU 
F KASTEN F SYSTEM 
-DE F BAU 
F KASTEN F SYSTEM 
DE F BAUKASTEN 
F SYSTEM 
MET . MET 
OOOX VOR 0002 FERTIG 
0003 STANCARC 0004 BAU 
0005 BAUTEN 0006 SERIE 
0007 IM ' 0008 BAUKASTEN 
0009 SYSTEM TEMPS FN SFC= 000003,6 
00000000-000005D8 00000 0000C5A0 O000C6DC O000C 
00000000 00000000 00000 00000000 0000C658 O000C 
0000C618 00000000 O000C 0000C5D8 0000C874 O000C 
00000000 0000C7B4 00000 00000000 0000CT44 O000C 
O000CTIC 00000000 O000C 0000C708 0000C816 00000 
00000000 O000CTFO O000C 0000C7C8 00000000 O000C 
0000C7B4 00000000 00000 00000000 0000C850 O000C 
0000C828 00000000 O000C OO00C6DC 0000C894 O000C 
0000C874 0000C990 O000C 00000000 00000000 00000 
00000000 0000C918 O000C 0000C804 00000000 O000C 
0000C89~ 0000C9E4 O000C 00000000 00000000 00000 
00000000 00000000 O000C 0000C990 O000CBE4 O000C 
00000000 O000CA8C 00000 00000000 0000CA44 O000C 
0000CA26 0000CA68 O000C 0000CA44 00000000 O000C 
O000CAIO O000CBO8 00000 00000000 O000CACO O000C 
O000CAAO O000CAE4 O000C O000CACOO0000000 O000C 
O000CA8C 0000CB84 00000 00000000 O000CB3C O000C 
O000CBIC O000CB60 O000C O000CB3C 00000000 O000C 
O000CB08 00000000 00000 00000000 O000CBCO O000C 
0000CB98 00000000 O000C O000CgE4OOOOCSBC O000C 
O000CBE4 00000000 00000 
. 9 . 
Tout le processus n'a dur~ que 3,6 secondes pour une demande de six 
mots dont quatre ont ~t~ d~coup~s en deux. 
Le num~ro de liste des groupes locutionnels est le premier 
argument de tri du deuxi~me fichiert qui donne ainsi pour chaque 
mot les num~ros des groupes locutionnels auxquels il appartient dans 
le dictionnaire. Les mots euxrm~mes ne r~apparaissent pas dans 
cette deuxi~me liste, mais seulement leurs caract~ristiques relati- 
vement ~ chaque groupe, qui permettent de v~rifier si les conditions 
d'existence du groupe sont remplies dans un texte que l'on analyse. 
(Illustration VI) 
Apr~s la consultation des deux premiers fichiers, les mots 
d'une demande ont ~t~ d~coup~s en fragments ou (et) r~unis en grou- 
pes locutionnels. Chaque fragment peut avoir aussi ~t~ identifi~ 
avec plusieurs homonymes. 
A chaque homonyme libre, comme ~ chaque fragment d'un groupe locu- 
tionnel, correspond une liste des num~ros des phrases-r~ponses va- 
lables pour lui. C'est le troisi~me fichier qui contient ces listes 
de num~ros de phrases, sans contenir les phrases elles-mSmes. Ii 
mentionne aussi les langues-cibles pour lesquelles ces phrases exis- 
tent, On remarquera le gain de temps obtenu en effectuant l'analyse 
jusqu'ici sans se soucier de la langue cible. Ce n'est qu'au moment 
de la consultation du troisiAme fichier pour la recherche de la 
meilleure phrase-r~ponse que se fait la s~paration du processuspar 
langues demand~es. 
Apr~sconsultation de ce troisi~me fichier, le programme 
attache ~ chaque radical d~coup~ dans une demande plusieurs paquets 
de num~ros de phrases-r~ponses, chaque paquet correspondant ~ un 
homonyme ou ~ une hypoth~se de groupe locutionnel. On obtient ain- 
si un tableau de num~ros de phrases o~ chaque phrase est cit~e un 
certain nombre de fois. Nous attribuons ~ chaque phrase uAe cote 
le pl~s souvent ~gale ~ ce nombre, moyennant certaines precautions 
dans les cas de d~coupes multiples. 
On choisit ensuite pour chaque fragment de la demande la phrase- 
r~ponse qui le concerne et qui possAde la cote la plus ~lev~e. 
Cela,constitue en mSme temps un choix parmi ses homonymes. Cependant 
plusieurs homonymes peuvent 8tre accept~s, avec la meilleure phrase-t 
r~ponse de chacun d'eux, si elles ont routes la m@me cote. 
L'appartenance ~ un groupe locutionnel n'~limine pour un mot routes 
ses autres hypotheses que sice groupe a, dans le texte envisage, 
une valeur de certitude qui est d~termin~e par programme. On se 
base sur des crit~res de certitude que nous ne pouvons ~num~rer ici. 
Disons par exemple qu'un verbe s~parable n'est reconnu avec certitu- 
de que dans le cas o~ la particule est coll~e au radical verbal. 
Dans les autres cas on permet ~ plusieurs hypotheses d'entrer en 
competition. 
Ce n'est qu'au moment d'~diter les r~sultats que l'on retire 
du dernier fichier les phrases-exemples elles-mSmes, qui viennent 
d'Stre choisies. 
.10 . 
Illustration VI 
Q r i~-'~ ~ 
'~ G.L. 
tO-~tS . G.L. ,~,k ~i,,,/,ks 
C-. L. ~l~ase~ 
Y 
.11 . 
Ce quatri~me fichier, tri~ par num~ros de phrases, peut 8tre beau- 
coup plus volumineux que les autres et tenir, s'il le faut, dans une! 
m~moire-mars. 
II nous reste ~ justifier quelques d~tails de l'analyse mor- 
phologique adopt~e ici. Elle se caract~rise ~out d'abord par la 
comparaison des unit~s lexicales ~ partir de la gauche. 
Les avantages de reconnaissance des formes ~ partir de la gauche 
sont li~s au fait que la machine consulte d'abord le lexique des i 
formes, et non pas des listes ferm~es de d~sinences, en commenqan~ 
par la droite. Le premier avantage, saul pour des unit~s lexicales I 
de moins de quatre lettres et des prefixes, r~side dans le fait que 
la machine va plus rite, parce qu'elle cr~e beaucoup moins d'hypo- 
theses inutiles, ainsi que nous l'avons v~rifi~ exp~rimentalement, 
en simulant les deux m~thodes. 
Mais il y a un deuxi~me avantage de loin le plus important surtout 
pour des langues comme l'allemand et le n~erlandais qui agglomArent 
en un mot des unit~s lexicales que l'on peut, -et que l'on dolt, - 
s~parer dans le lexique. En effet le programme peut effectuer en 
une seule fois les d~coupes des mots et des d~sinences, jusqu'~ ~pui- 
sement et sans retour en arri~re. 
Enfin, nous avons group~ les innombrables d~clinaisons des substan- 
tifs allemands en admetant une seule liste de d~sinences pour tous, 
d~finie par le code signifiant substantif. (Illustration VII) 
La simplification des d~clinaisons allemand~ au point de les ramener 
routes ~ une seule, facilite ~norm~ment le codage du dictionnaire, 
si nous le comparons au codage n~cessaire pour l'analyse morphologi -I 
que ~labor~e par le grouse de Grenoble, qui tient compte de vingt- 
trois listes distinctes de d~sinences pour les substantifs allemands. 
Que sacrifions-nous ~ cette simplification ? 
Ii n'y a aucun danger, dans le cas present, ~ admettre pour un subs- 
tantif des d~sinences qu'il ne prendra en r~alit~ jamais. En effet 
si cela pouvait mener ~ confondre deux substantifs, il suffirait de 
donner toutes leurs formes dans le dictionnaire et de les traiter 
comme des mots invariables. Nous n'avons pas rencontr~ cette situa- 
tion sur plusieurs milliers de mots de textes techniques trait~s 
ainsi. De toutes mani~res, dans le but d'obtenir une d~coupe rapide 
des compos~s, faite de gauche ~ droite et en un seul passage, nous 
donnons deux formes dans le dictionnaire pour les substantifs qui 
prennent un "umlaut" ou pour tout autre changement de radical. 
Notre analyse perd une seule information, celle de savoir ~ quel cas 
et ~ quel nombre appartient un substantif donn~ dans un texte. Elle 
convient donc pour les applications pour lesquelles ces renseigne- 
ments seraient superflus, telles que les consultations automatiques 
de dictionnaires qui ne seraient pas suivies d'analyses syntaxiques. 
• 12 . 
mots qui 
les acceptent I 
d~sinences 
blanc 
CHEN 
CHENS 
E 
EM 
EN 
END 
ER 
ES 
EST 
ET 
ETE 
ETEN 
ETEST 
ETET 
LEIN 
LEINS 
N 
ND 
NEN 
R 
S 
SE 
SEN 
SES 
ST 
T 
TE 
TEN 
TEST 
TET 
Illustration VII 
noms 
F I 
O O 
O 
O 
O O 
O" O 
O O 
O 
O 
O O 
O O 
O 
O 
O 
adjectifs 
FetI F 
o o 
o 
o 
o 
o "o 
o 
o 
o 
forts 
0 
0 
0 
o 
o! 
o 
o 
o 
verbes 
faibles 
F 
O 
O 
O 
O 
O 
O 
O 
O 
O 
o 
participes I 
F 
.i 
o 
o 
o 
o 
o 
F = finales I = interm~diaires, 
• 13 . 
Au moment de conclure, il est bon de passer en revue quel- 
ques points que soul~ve la lexicographie classique et de voir dans 
quelle mesure ils nous concernent ici. 
Ii s'agit principalement du choix des termes ~ introduire dans un 
dictionnaire, c'est-~-dire de la d~limitation d'un domaine s~mantique 
et du relev~ du plus grand nombre possible de termes que s'y rappor- 
tent, ensuite des relations s~mantiques entre les termes c'est-~- 
dire de la structuration s~mantique ~ l'int~rieur du lexique choisi; 
et enfin des probl~mes d'adressage, c'est-~-dire de l'organisation 
mat~rielle en vue de la consultation, emplacement des termes, r~p~- 
tition ~ventuelle, orthographes multiples etc... 
Si nous n'avons pas centr~ notre expos~ sur ces questions, c'est que 
le traitement en ordinateur les r~soud assez naturellement ~ condi- 
tion d'introduire en machine les donn~es compl~tes et primitives• 
L'adressage tout d'abord est ~ ce point ais~ que l'on peut multiplier 
souhait les orthographes et que les probl~mes d'emplacement et de 
r~p~tition ne se posent plus. 
En introduisant en machine des fragments de textes authentiques, 
nous notons en m~me temps leur r~f~rence bibliographique et un ou 
plusieurs codes mati~res d~finissant le contexte dont ils ont ~t~ 
extraits. Ces informations sont par l~-m~me et sans autre travail 
attach~es aux termes contenus dans ces fragments. Comme la m~moire 
de la machine est pratiquement illimit~e, on ne doit refuser aucun 
terme ~ l'entr~e, ni s~parer explicitement des domaines, tels la 
sid~rurgie, l'architecture etc... Tout au plus devra-t-on attacher 
certaines unit~s lexicales un signe sp~cifiant qu'elles n'ont au- 
cun int~r~t par elles-m~mes dans un dictionnaire technique (par exem- 
ple pour des mots comme "faire", "grand", "froid" etc.). 
Une liste parfois longue de codes-mati~res se trouve attach~e 
chaque unit~ par le truchement des diverses phrases-exemples. Ii 
s'~tablit ainsi spontan~ment une structuration s~mantique complexe 
l'int~rieur du syst~me que l'on pourrait d~couvrir par des techni- 
ques taxonomiques. Elle est plus richeque la structure en arbores- 
cence (analogue ~ la classification d~cimale universelle)la seule 
qui soit r~alisable dans un dictionnaire habitueS, ~ cSt~ du classe- 
ment alphab~tique. 
Au moment de formuler une demande, sous forme de "phrase 
difficile~ traduire", le champ s~mantique est d~limit~ implicitement 
par le fait que la machine ne cherche que des phrases r~ponses aussi 
proches que possiblede la demande. Le traducteur reqoit un glossai- 
re qui ne se rapporte qu'~ son texte et dans l'ordre d'apparition 
des termeso 
• 14 . 
Une mise ~ jour r~guli~re eat pr~vue qui supprime le probl~me d'une 
certaine compl~tude au d~part, et permet d'enregistrer rapidement 
ces n~ologismes qui font d~faut dans les dictionnaires ordinaires, 
souvent d~pass~s d~s leur sortie de presae : Les pertes de temps 
consid~rables, occaaionn~es par des recherches fastidieuses et sou- 
vent vaines, seront r~duites au strict minimum. 
L'~tablissement d'une v~ritable collaboration entre les compilateurs 
du dictionnaire et lea utilisateurs mettra ~ la disposition de tous 
les donn~es dont diapoaent quelques-uns et qui risquent, autrement 
d'etre enfouis ~ tout jamais dans quelque obscur fichier personnel. 
Cet instrument souple, puisqu'adaptable ~ toutes sortes de demandes, 
peut non seulement faciliter consid~rablement le travail de son 
utilisateur, mais lui offre aussi, sans effort suppl~mentaire de sa 
part, la possibilit~ d'un travail plus rapide et de meilleure quali- 
tY, ainsi qu'une sp~cialisation sans peine. 
Syst~me maniable, facile ~ ~tendre et ~ corriger, l'outil de 
travail tel que noua le proposons offre de multiples avantages, et 
de loin de favoriser l'~limination du traducteur humain, il pourra 
bien au contraire constituer une aide appreciable dans son travail. 
.15. 

References

I.A. MELCUK . Analyse morphologique en traduction automatique. 
"ProblAmes de Cyberm~tique" Vol. 6 - 1961 , pp.207-276. 

L.E. DOSTERT , R.R. MACDONALD . Georgetown University Machine Transla- 
tion Research project . General report 1952 - 1963 (n°30) june 1963. 

G. LAURENT , A. BERNARD-GEORGES , D. LEVENBACH . Etude Morphologique 
du substantif allemand -Grenoble, avril 1962 - EUR 525f. 1964• 

J. BLOIS , Fr. DECRESY , J. MOMMENS . Analyse morphologique automati- 
que~du franqais . Universit~ libre de Bruxelles . Mars 1963. 

DICAUTOM . - La " Traduction Automatique " - 1963 , Vol.IV n°3 (Mouton) 

L. HIRSCHBERG . Dictionnaires automatiques pour traducteurs humains. 
" Journal des Traducteurs ", Montreal , Vol.10, n°3 (1965)pp. 78-86• 

J.A. BACHRACH . Une m~thode en terminologie . Comptes rendus du 
" Colloque de Linguistique Appliqu~e " -Ceca Luxembourg- avril 1966. 

L. HIRSCHBERG . Conception, construction et utilisation de dictionnai- 
res automatiques mu%tilingues. Uomptes rendus du " Colloque de Linguis- 
tique Appliqu~e " - Ceca, Luxembourg - avril 1966. 
