I - HISTORIQUE DU PROJET 
Nos recherches ont d6but6 il y a bientOt quatre ans. Ce pro- 
jet fut d'abord int6gr6 aux activit6s g6n6rales de la Facult6 des Let- 
tres de l'Universit6 de Montr6al; maintenant, il d6pend directement du 
vice-recteur ~ la recherche de la mSme universit6. 
Nous sommes particuli~rement reconnaissants ~ l'~gard du 
premier directeur de ce projet, M. Guy Rondeau, qui obtint une subven- 
tion du Conseil National de la Recherche (laquelle est renouvel6e an- 
nuellement) et envers la direction du projet C.E.T.A. ~ Grenoble pour 
avoir favoris~ la formation de plusieurs d'entre nous. 
Notre groupe est maintenant compos~ de quatre linguistes et 
de quatre ing~nieurs-informaticiens ou programmeurs dont M. Alain 
Colmerauer qui agit comme directeur depuis peu. 
Les travaux que nous conduisons et dont nous allons vous en- 
tretenir concernent uniquement ceux qui sont li~s au projet de la tra- 
duction automatique. 
Le document que nous vous avons pr6sent~ ne fait pas 6tat 
non plus des recherches ant6rieures, notamment celles qui port,rent sur 
l'utilisation de divers modules de reconnaissance applicables aux lan- 
gues naturelles. 
En ce qui concerne ces recherches, des rapports p~riodiques 
continuent de para~tre et le dernier d'entre eux ajoute consid~rable- 
ment aux notes trop succintes qui vont suivre. 
II - GRAMMAIRES-W 
Nous ne donnerons ni une histoire ni une description formel- 
le du syst~me-W; nos coll~gues informaticiens le font dans une communi- 
cation au Congr~s de I'A.C.M., San Francisco, Aoflt 1969 \[DE CHASTELLIER 
et COLMERAUER (1969) \]. Nous voulons plutOt expliquer rapidement l'usa- 
ge linguistique que nous raisons des caract~ristiques de ce syst~me. 
Celui-ci consiste en un parseur-interpr6teur (P.I.) et un 
synth6tiseur, tous deux de puissance transformationnelle, Le synth6ti- 
seur est l'inverse du P.I. ~ quelques d~tails pros, et nous ne consider 
rons que le P.I. dans ce qui suit. Les entr~es de dictionnaire sont 
6crites darts le m~me format et avec le m~me st@tut que les autres r~ 
gles, et jusqu'ici il n'y a pas de traitement s~par~ pour le diction- 
naire \[cf. section V\]. 
2 
Le syst~me est essentiellement destin~ ~ tra~ter des cha~- 
nes, quoiqu'il permette aussi, comme nous le verrons, de traiter des 
arbres. La donn~e d'entr~e pour le P.I. est constitute d'une cha~ne 
et d'une gram~aire; la sortie est une (ou des) chaSne(s) "interpr~- 
t6e(s)". La difference entre chaSne et cha~ne interpr~t6e est la sui- 
vante: la premiere est une s~quence non concat~n~e, que l'on peut 
concat~ner par la suite en lui appliquant des r~gles appropri~es; la 
seconde a subi la concat6nation et forme un symbole complexe unique. 
La consequence, parfois g6nante, en est que le P.I. ne peut traiter 
une chalne interpr6t6e que dans sa totalitY. Par exemple, si on a 
appliqu6 une r~gle: 
THE MAN . SPOKE --~ THE~MAN~POKE 
il sera impossible d'appliquer des r~gles subs~quentes ~ SPOKE, 
moins que la r~gle ne sp~cifie THE'~IAN aussi. 
Les structures d'arbre peuvent 8tre indiqu6es par des cha~- 
nes parenth6s6es. De m6me on peut introduire des 6tiquettes de noeuds 
ou de fonctiens dans les cha~nes; il n'y a pas d'indices souscrits. 
Dans la description formelle, les chaYnes interpr6t~es fi- 
nales sont appel6es "chaines axiomatiques". (Le synth6tiseur commence 
sa d6rivation ~ partir de ces "chalnes axiomatiques".) Dans notre 
syst~me de traduction, la donn6e de P.l. comporte une chaine anglaise 
\[cf. section VI\]; les "chaines axiomatiques" sont des chalnes de notre 
langage pivot \[cf. section IV\]; la sortie du synth6tiseur est une tra- 
duction en un fran§ais "restreint" \[cf. section VII\]. Le P.l. et le 
synth6tiseur peuvent 6tre enchaln6s pour passage direct de l'anglais 
au fran~ais. 
Une grammaire West faite de deux parties, i.e. deux ensem- 
bles de r~gles disjoints, qui sont d6crits ci-dessous. Le syst~me ap- 
plique chacune des deux parties l'une apr~s l'autre, ~ chaque 6tape du 
traitement. Cette alternance continuelle est peut 6tre le trait le 
plus inhahituel de la grammaire W, pour un linguiste, et les commen~ 
qants prennent en g6n6ral quelques semaines pour s'y faire. 
Le P.l. avance de gauche ~ droite sur la chaTne d'entr6e, 
ajoutant un symhole ~ la lois (s6par6 par des blancs de part et d'au- 
tre) au segment d6j~ interpr6t6. Pour chaque segment, il 6tablit un 
r6seau de noeuds 6tiquet6s, que nous pouvons repr6senter comme un demi 
treillis \[el. fig. lJ. 
1 I HEJ LSPOKEJ 
Meta-rules: 
i. S 
2. NP 
3. DET 
4. NOUN 
5. VERB 
== NP VERB 
DET NOUN 
THE 
MAN 
SPOKE 
---> :this arc completes 
the graph but is not 
used in the PS structure 
specified by the meta- 
rules. 
Line des parties de la grammaire est constitu6e de "m~tar~- 
gles". Celles-ci sont C.F. Le syst~me les utilise pour ~tiqueter cer- 
tains noeuds du r~seau. Les r~gies unaires attachent plusieurs ~ti- 
quettes au m~me noeud. Nous pouvons consid6rer que les autres fabri- 
quent des arbres de structures constituants, si nous ~crivons la gram- 
maire dans ce sens. 
Une cha~ne ainsi trait6e peut d6sormais ~tre d6crite par le 
profil d'une section ~ travers le r~seau que la m6tagrammaire lui a at- 
tachS. Pour cela, il fait ~noncer, de gauche ~ droite, les noms des 
noeuds que le profil traverse - et qui doivent donc avoir ~t~ intro- 
duits par les m6tar~gles - Ainsi la chaine de la fig. 1 peut se d~crire 
par "DETERMINER MAN SPOKE" ou "NP SPOKE", ou tout autre profil correct. 
Enfin, tout un "arbre" peut ~tre d~not~ simplement par le nom de son 
noeud sup~rieur. \[fig. 2\] 
Additional meta-rules: 
6, S ~ ADV S 
7. ADV ~ UNFORTUNATELY 
S 
ADV I //~virtue of rules I-5) 
UNFORTIINATELYJ 
THE MAN SPOKE 
Sur chaque segment, le syst~me effectue toutes les analy- 
ses possibles scion les m6tar~gies. Comme dans d)autres algorithmes 
(par exemple celui de Cocke) ceci produit des analyses de sous-chal- 
nes qui stav~reront abortives avant que le traitement de route la 
chalne dTentr6e soit achev~. I1 faut admettre que cette strategic 
charge la m~moire de l'ordinateur, et pour le moment nos chaSnes 
sont limit~es ~ environ 30 symboles. \[mais voir Section VIII\] 
La description par profils s'est av6r6e tr~s utile pour 
l'6criture des autres r~gles de la grammaire, appel6es "pseudor~gles" 
(ce nom n'est pas tr~s r6v~lateur quant ~ l'usage que les linguistes 
font de ces r~gles). 
Dans la partie transformationnelle, on peut donc 6crire des 
"pseudor~gles" qui, jointes aux m~tar~gles, g~n~rent un langage de ty- 
pe 0. II n'y a pas de restriction sur le nombre de symboles ni les 
types d'op6rations dans ces r~gles. Comme un symbole peut nommer un 
arbre - grace aux m~tar~gles - le r~sultat pratique est un pouyoir con- 
sid6rable dans le traitement des arbres. En fait nous pensons que le 
syst~me W pourrait ~tre utilis~ comme testeur de graF~aires transforma. 
tionnelles, moyennant l'introduction de certaines am61iorations, par 
exemple ordre des r~gles. 
La fig. 3 donne un exemple de grammaire W - linguistiquement 
616mentaire mais compl~te - ainsi qu'une sortie correspondante. Dans 
le P.l., les r~gles doivent se life "<membre droit> est r6~crit 
<membre gauche> ". Pour la clart6 de l'expos6, nous avons quelque peu 
chang~ le format de la sortie machine r6elle. 
(OPERATORS) 
=~ : IS RE-WRITtEN 
+ : CONCATENATED WITH 
$ : END OF A RULE, OR OF A SET OF RULES WITH IDENTICAL 
LEFT-HAND MEMBERS 
* : COMMENT BOUNDARY 
* THE SYMBOLS USED FOR THE ABOVE OPERATORS ARE 
CHOSEN BY THE LINGUIST AND ARE INPUT WITH THE 
DATA * 
6 
I) X REPRESENTS ANY SINGLE TERMINAL SYMBOL 
* THIS RULE IS INCORPORATED IN THE 
PROGRAM * 
2) ~rrRANSITIVE-SENTENCE u VERB sUBJECT-{ NOUN-PHRASE ) 
3) NOUN-PHRASE w ADJECTIVE NOUN 
4) ~ DETERMINER NOUN-PHRASE $ 
S} ADJECTIVE ~ ( ADJ X ) $ 
6} NOUN = {NNX ) $ 
7} DETERMINER ::~ ( A-REFERRED-TO ) $ 
* AS DETERMINERS ARE A SMALL CLOSED CLASS IT 
IS A WORTHWILE SIMPLIFICATION MERELY TO LIST 
THEM. * 
8) VERB _---- { VB X TENSE } $ 
9) TENSE ~ PAST $ 
INTRANSITIVE-SENTENCE * THIS IS THE DECLARATION OF THE 
SUMMIT SYMBOL WHICH IS TO TERMINATE 
THE PARSING PROCESS PROVIDED THE 
WHOLE INPUT STRING IS INCLUDED UNDER 
IT * 
* NOTE TOO THAT A SYMBOL IS DEFINED IN THE PROGRAM 
AS AN UNBROKEN STRING OF CHARACTERS BETWEEN TWO BLANKS, 
SO THAT A HYPHENATED COMPOUND IS ONE SYMBOL * 
(PSEUDO-RULES) 
i0) ( ADJ HAIR-LORN ) ,., BALD $ 
11) ( NN MALE-HUMAN ) ~ MAN $ 
12) ( VB SPEAK P~T ) ~_ SPOKE $ 
13) ( A-REFERRED-TO ) ~ THE $ 
* THERE IS NO NEED OF A PART-OF SPEECH 
MARKER FOR THE DETERMINER, BECAUSE IT IS 
ALLOCATED SPECIFICALLY TO ITS SYNTACTIC 
CATEGORY BY RULE 7 * 
14) ( NOUN-PHRASE ) ~ NOUN-PHRASE $ 
* A TYPICAL RULE FOR INSERTING PARENTHESES, 
WHICH THEN HAVE THE FORMAL STATUS OF 
TERMINAL SYMBOLS * 
iS) ADJECTIVE NOUN =- ADJECTIVE + NOUN $ 
16) DETERMINER NOUN-PHRASE __--- DETERMINER 4.- NOUN-PHRASE $ 
* CONCATENATION RULES LIKE IS THROUGH 17 ARE 
REQUIRED FOR REASONS TO DO WITH THE FORMALISM 
OF THE W-SYSTEM * 
17) SUBJECT-( NOUN-PHRASE ) VERB 
--_ ( NOUN-PHRASE ) ,4-VERB-~- . $ 
* A TYPICAL RULE FOR INSERTING A LABEL OF 
SYNTACTIC FUNCTION * 
I 
18) VERB SUBJECT-( NOUN-PHRASE ) 
= SUBJECT-( NOUN-PHRASE ) VERB $ 
* TYPICAL RULE FOR TRANSPOSING A SUB-TREE. 
ACTUALLY RULES 17 AND 18 COULD BE COMBINED 
INTO ONE RULE * 
'i 
(INTERPRETATIONS) 
i" 
* ABORTIVE INTERPRETATIONS HAVE BEEN SUPPRESSED FOR BREVITY * 
* INPUT STRING: THE BALD MAN SPOKE . * 
1) ( A-REFERRED-TO ) 
2) ( AOJ HAIR-LORn ) 
..5). ( NN MALE-HUMAN ) 
- .. 4). ( ADJ. HAIR-LORN .) 
5) ( A-REFERRED-TO ) 
THE * BY RULE 13 * 
u BALD * BY RULE i0 * 
m: MAN * BY RULE 11 * 
( NN MALE-HUMAN ) ~,~ LINES 2 + 3 
• BY RULES S, 6, 15 * 
(ADJ HAIR-LOaN ). (NN MALE-HUMAN ) 
= LINES 1 ~ 4 * BY RULES 7, 5, 6, 3, 
16 * 
6) ( ( A-REFERRED-TO ) ( ADJ HAIR-LORN ) ( NN MALE-HUMAN 
LINE 5 * BY RULES 7, 5, 6, 3, 4, 
14 * 
7) ( VB SPEAK PAST ) ~ SPOKE * BY RULE 12 * 
)) 
8) 
9) 
SUBJECT-( ( A-REFERRED-T0 ) ( ADJ HAIR-LORN ) 
( NN MALE-HUMAN ) ) ) ( VB SPEAK PAST ) 
---~ LINES 6 4- 7 
* BY RULES 7, 5, 6, 3, 4, 9, 8, 17 * 
( VB SPEAK PAST ) SUBJECT-( ( A-REFERRED-TO ) 
( ADJ HAIR-LORN ) ( NN MALE-~ ) ) . 
LINE 8 
* BY RULES 7, 5, 6, 3, 4, 9, 8, i8 * 
* LINE 9 IS THE SOLE ULTIMATE INTERPRETATION - IN FORMAL 
TERMS~ THE SOLE AXIOMATIC STRING - SINCE THE WHOLE 
INPUT STRING IS DERIVABLE FROM IT AND IT IS DOMINATED, 
ACCORDING TO THE METAG~, BY 'INTRANSITIVE-,SENTENCE' 
WHICH HAS BEEN DECLARED AS THE NAME OF THE TERMINATING 
OPERATOR * 
10 
III - ESQUISSE DVLIN MODELE DE TRADUCTION 
O. La disponibilit~ du syst~me W, si puissantj sous certains 
rapports, a pouss~ certains dtentre nous ~ la r~flexion th~orique. 
I1 nous fallait en effet faire des choix parmi les possibilit~s 
offertes pour le traitement des donn~es linguistiques. 
On peut se representer id~alement la "facult~ de langage" 
dtun home come une machine non d~terministique qui a pour fonc~ 
tion dteffectuer une correspondance entre certaines chaSnes sonores 
et certaines representations s~mantiques tongues comme une collec- 
tion de relations choisies (par une operation que nous pouvons 
qualifier d t "abstraction") parmi celles qui existeraient entre 
des ~l~ments de la perception. 
La traduction id~ale, comme chacun salt, consiste ~ "com- 
prendre" un texte dans une langue - ctest-~-dire ~ construire 1~ 
oa les representations s~mantiques correspondantes - et ~ "parler" 
dans une autre langue - c'est-~-dire effectuer dans lVautre langue 
les operations conduisant de la representation s~mantique ~ la 
cha~ne sonore. Id~alement, la seconde phase devrait ~tre fortement 
conditionn~ par la premiere, et nous devrons examiner les points 
de correspondanee. 
1. La facult~ de langage 
I1 est utile dVimaginer les structures s~mantiques comme 
des graphes (qui nVont a priori aueune raison dV~tre des arbores- 
cenees) dont les noeuds - ou les ar~tes - sont ~tiquet~s par des 
indices de raf~rence et des noms de relations existant entre cer- 
tains de ees indices. Le "probl~me" du locuteur est de representer 
ces structures sous forme de chaSnes parenth~s~es, c'est-~-dire, 
en premiere approximation sous forme de structures de constituants. 
Ce probl~me a deux aspects: dWune part, la representation de la 
structure du graphe d'autre part la representation sonore (ou 
graphique) des ~l~ments "substantifs" (i.e. des ~tiquettes rela- 
tionnelles de ee graphe). 
La premiere pattie est commun~ment appel~e syntaxe. Dans 
les termes employ~s ici, elle consiste ~ crier des structures de 
eonstituants pour representer une partie des configurations du 
graphe s~mantique. Nous nous repr~senterons cette partie de la fa- 
eult~ de langage eomme une collection de modules op~ratoires, eha- 
curt effectuant une seule operation sous le contr6le de param~tres 
d~erivant les structures s~mantiques ~ transformer. \[Voir HOF~N 
2. 
3. 
11 
(1968) pour un exemple d'une telle operation\] 
La deuxi~me pattie est le lexique. Celui-ci peut 8tre vu 
comme une relation binaire dont les premiers arguments sont des 
paquets de traits s~mantiques et les seconds arguments des matri- 
ces phonologiques (-Bans le cas d'un syst~me operant sur des tex- 
tes ~crits, le lexique sera une relation entre des paquets de 
traits s~mantiques et des chaSnes de caract~res). La relation 
"lexique" n'est pas une fonction, en ce qu'un paquet de traits 
s~mantiques donn~ peut avoir un correspondant phonique different 
selon des circonstances paralinguistiques. I1 est int~ressant 
d'introduire 1~ des param~tres d' "attitude" , "style" etc. 
\[voir section V\] Mentionnons en passant qu'il est s~duisant (et 
apr~s tout raisonnable) de faire l'hypoth~se suivante: la forme 
des divers modules syntaxiques et 1'ensemble de tousles traits 
s~mantiques semblent 8tre universels. Par contre les valeurs des 
param~tres de contr81e des modules syntaxiques, ainsi que la re- 
lation "lexique" avec tous ses param~tres, semblent ~tre acquis 
par ~ducation dans une soci~t~ donn~e. 
Une traduction consistera done en deux lois deux opera- 
tions. Premi~rement, des formes phoniques Pl - ou ~crites - se- 
ront identifi~es et appliqu~es sur des paquets de traits s~man- 
tiques ~ par la relation "lexique 1" tandis que les structures 
de constituants seront analys~es et appliqu~es sur un graphe 
- ~tiquet~es par les ~ - par 1'operation des modules syntaxiques 
(les param~tres ayant les valeurs ~). 
Deuxi~mement les graphes ainsi obt~/lus seront trait~s par les m~- 
mes modules syntaxiques, dont les param~tres auront pris les va- 
1curs P2 correspondant ~ la langue cible, tandis que les ~tiquet~ 
tes ~ g~ront appliqu~es sur des chatnes de caract~res ou des ma- 
trices phonologiques P2 par la relation "lexique 2". 
Cette representation rationnalise (il n'est pas possible 
de parler de v~ritable "justification") l'approche que nous 
avons adopt~e en ce qui concerne le traitement automatique du 
probl~me de traduction, telle qu'elle est pr~sent~e dans les sec- 
tions suivantes. 
Notons un fair important. Les param~tres syntaxiques ou 
lexicaux acquis par ~ducation dans une certaine soci~t~ sont for- 
tement variables ~ l'int~rieur m~me d'une langue donn~e (varia- 
tions "dialectales", "stylistiques" etc.) L'attitude et la sensi- 
bilit~ du traducteur envers ces variations peut diff~rer ~norm~- 
ment. L'id~al serait que la traduction respecte routes les nuances. 
Bans le cas de la traduction automatique, toutefois, ceci implique- 
rait une "analyse culturelle" qui reste ~ faire. Voici une d~ci- 
sion possible: on choisira d'accepter autant de structures possi- 
12 
bles darts la lamgue source, e'est-~-dire qu'on permettra aux 
param~tres la plus large variation compatible avec l'intelligibi- 
lit~ (61argir le domaine de variation d'un param~tre de contr81e 
diminue naturellement l'information apport~e par l'op~ration 
correslmndante}. On essaiera tout de mSme de corr~ler autant que 
possible les valeurs des param~tres - surtout dans le lexique - 
avec des niveaux de style, etc. Du cOt~ de la langue cible, on 
se contentera pour un temps de transmettre 1'information n~cessai- 
re, e'est-~-dire qu'on restreindra fortement la variation des pa- 
ram~tres autour de la valeur correspondant approximativement au 
"standard" du langage. (On pourra m6me aller au del~ en restrei- 
gnant chaque structure ~ une seule expression dans la langue ci- 
ble. 
IV -" LE LANGAGE PIVOT 
Le langage pivot est un langage formel apte ~ d6finir des 
relations s~mantiques. Les ~l~ments qui le composent sont des mots - 
appel~s z-mots darts notre syst~me - qui correspondent d'une fa~on 
univoque ~ des configurations s~mantiques d'un type particulier (res- 
treintes darts notre syst~me aetuel ~ la paire anglais-fran§ais); ces 
mots ne sont done pas ambigus et n'ont pas de synonymes. L'ordre ca- 
nonique darts lequel ces z-mots sont disposes indique les relations 
s~mantiques qu'il entretiennent. 
Par rapport au module de traduction, une chaSne du langage 
pivot ne fournit qu'une repr6sentation s~mantique pour chaque chaSne 
de lex~mes de la langue source et pour une ou plusieurs chaSnes de 
lex~mes dans la langue cible. Tel qu'utilis~ dans mtre syst~me, le 
langage pivot fournit des cha~nes qui constituent la sortie de l'ana- 
lyseur de l'anglais et deviennent en m~me temps l'entr~e pour le g~- 
n~rateur du fran~ais. Plus explicitement, l'analyseur transforme une 
suite de mots et de signes de ponetuation de l'anglais en autant de 
chaSnes canoniques du langage pivot qu'il y a de sens diff6rents at- 
tribu6s ~ eette suite. Le g~n6rateur va traiter cette chaSne canoni- 
que et la transformer ~ son tour en une ou plusieurs suites de lex~- 
mes du fran~ais dont une au moins dolt correspondre ~ la configuration 
s~mantique exprim~e dans la cha~ne du langage pivot. 
Le z-mot auquel correspond un ensemble d~fini de lex~mes 
appartient au lexique. On obtient autant de z-mots pour un lex~me 
que celui-ci a de sens diff~rents d'ambiguit6; par contre, un seul 
z-mot recouvre touteune classe de lex~mes synonymes. Ces z-mots 
ne constituent pas des traductions fran~aises de mots anglais mais 
plutSt des entit~s abstraites qui recouvrent une ou plusieurs confi, 
gurations s~mantiques particuli~res qui prendront dans diff~rentes 
13 
langues naturelles diff~rentes configurations graph~miques ou phon6- 
miques. 
Les relations qu'entretiennent les ~l~ments du langage pi- 
vot sont exprim~es par des structures de d6pendance. Celles-ci ont 
6t6 imagin~es tout d'abord par Tesni~re, et l'usage que nous en raisons 
est inspir6 des ~tudes effectu~es ~ Grenoble; toutefois la forme dans 
laquelle nous les utilisons est conditionn~e par nos besoins particu- 
liers. Le tableau suivant illustre la structure de d6pendance caract~- 
ristique de notre module. 
actant I actant 2 actant 3 
modificateurs modificateurs modificateur 
Une autre structure consiste dans la coordination d'~l~ments d'une m~- 
me classe (par exemple des adjectifs); elle correspond ~: 
X I X 2 X 3 X n 
0. 
14 
L'adaptation des structures de d~pendance se fait natu- 
rellement ~ mesure que la grammaire devient plus complexe ou que 
le formalisme re~oit des modifications. Par exemple, nous vou- 
lons introduire sous peu des sp~cificateurs de phrases comme 
"interrogatif", "imp~ratif", etc. et inclure dans cette classe 
d'op~rateurs ceux du temps, de la n~gation, du modal et de l'ad- 
verbe. 
La sortie des chaSnes de ce module de d~pendance cor- 
respond actuellement ~ une representation lin~aire des ~l~ments. 
Le gouverneur precede la cha~ne gouvern~e elle-m~me entre paren- 
theses. Dans le cas o~ la fonction s~mantique r~v~l~e dans cha- 
cune des cha~nes gouvern~es par un mSme gouverneur n'est pas la 
m~me, comme cela se produit pour les premier, deuxi~me, troisi~- 
me actants, on ajoute des ~tiquettes pour indiquer le type de 
d~pendance dans chacun des cas. *L'6tiquette "epi-" s'emploie 
pour marquer des eha~nes qui modifient la chaYne qui les gouver- 
ne. Par exemple, les relatives sont pr~c~d~es de cette ~tiquette 
parce qu'elles modifient le groupe nominal qui les gouverne. 
V - LEXICOGRAPHIE 
Jusqu'~ la rbdaction de cet article, notre travail lexicographi~ 
que s'est surtout occup6 de la "conversion" des mots anglais en 
lex~mes de notre langage intermgdiaire (pivot). 
La figure 1 illustre une entree de dictionnaire pour un 
verbe anglais. La ligne 2 de l'exemple pr~sente ce que nous ap- 
pelons l'entr~e primaire: elle contient toute l'information no- 
t6e par notre lexicographe, y compris une citation. La citation 
est encadr~e par des ast~risques, et trait~e comme un "commen- 
taire" par les programmes de traitement. Au-dessus de chaque 
symbole de l'entr~e primaire apparaYt la variable lexicale dont 
le symbole est une valeur. Dans le syst~me W que nous utilisons 
\[voir section II\] ces variables sont d~finies dans les "m6tar~- 
gles", soit par listes de'valeurs, soit par un schema de la 
forme: 
ZWORD =~ Z X / X repr~sente n'importe quelle valeun 
Les entr6es de dictionnaire proprement dites sont ~crites 
dans le format g~n6ral des "pseudor~gles" de la grammaire-W, et 
ont le m6me statut que les autres r~gles de ce type. £n cons~ 
quence elles peuvent 6tre soumises directement aux r~gles 
* On pourrait se contenter de l'ordre des chaSnes. 
II 
4Zo ! 
~ e 
y 
~==~-~ ~ .. 
o 
~r~-~, ~ 
~~ N 
ii 
,i 
15 
16 
d'interpr~tation de la grammaire, et peu importe le format choisi 
pour les entr~es primaires, tant qu'elles satisfont au format g6- 
n~ral des grammaires-W. En effet on peut 6crire facilement les 
r~gles n6eessaires pour les transcrire dans un format compatible 
avee la partie "syntaxique" de la grammaire. Ainsi on peut intro- 
duire beaucoup de d~tails descriptifs dans les entr~es de dic- 
tionnaire m6me si nous n'en avons pas l'usage pour le moment. Mal- 
heureusement, chaque r~gle de traitement du dietionnaire accroSt 
la grammaire et par cons6quent le temps de traitement, paree que 
le programme d'application de la grammaire W essaie chaque r~gle 
chaque phase du traitement. I1 est ~vident qu'il nous faudra 
6crire sous peu un programme particulier de consultation du dic- 
tionnaire, m~me si nous pouvons nous en tirer pour le moment en 
encha~nant deux grammaires-W, dont la premiere ne se compose que 
de r~gles de ee niveau. 
La ligne 3 dans la figure est la r~gle qui r~crit l'entr~e pri- 
maire dans le format requis ~ present dans notre grammaire. La 
ligne 4 est le r6sultat de l'application de cette r~gle. Toutes 
les valeurs encadr~es par des crochets sont "persistantes" - 
c'est-~-dire sont conserv~es dans le pivot - Les lex~mes du pi- 
vot sont done des symboles complexes limit,s par des crochets, 
La ligne 5 illustre une r~gle "morphologique", qui ex- 
plicite le temps du verbe et le met sous la forme RACINE/TEMPS 
correspondant ~ la ligne 4. Cette r~gle fair ~galement partie 
des "pseudor~gles", et n'a pas de statut particulier. 
Nous allons ~ present examiner l'importance linguistique 
des diverses variables. 
1. ZWORD 
Nous avons donn~ il y a quelque temps dans un article 
\[Harris (1968)\] une description formelle des z-mots. 
Nous consid~rions qu'un ~l~ment de ce vocabulaire de 
z-mots ~tait un symbole pour une variable s~mantique 
dont les valeurs ~taient des sens de lex~mes 
et franqais. En fait, nous posions g ~ creation 
d'un z-mot la condition qu'il existait dans chaque 
langue au moins un lex~me dont un sens appartiendrait 
au domaine de variation de la variable ~ repr6senter 
par ce z-mot. Les valeurs peuvent 8tre des racines 
lexicales sujettes ~ d~clinaison et affixation, ou des 
formes compl~tes de surface, ou des morphemes de pro~ 
fondeur sujets ~ des transformations de la grammaire. 
Exemple: 
17 
AnglaJs Pivot Franqais { 
(I) would (ask) ~ f(Je) voudrais (demander)~ 
~ith great respect (I ask)~zrespectfully.~(Je demander) ais 
/ / ! 
(I ask) ,fl \[(Je) me permets de | 
(demander) 
Tousles ~l~ments de lVensemble de sens anglais sont synonymes; les 
~l~mentsde l'ensemble fran~ais sont synonymes aussi et traduisent 
lVensemble anglais. Ainsi un z-mot-~tait consid~r~ comme une ~tiquet- 
te pour une fonction de traduction dent les arguments ~taient un en- 
semble de synonymes en anglais et un en fran~ais. I1 n'est peut 8tre 
pas compl~tement inutile ici de mettre en garde contre des pr~somp- 
tions dWuniversalit~: jusqu'ici notre recherche a ~t~ strictement 
limit~e ~ 11anglais et au fran~ais. Toutefois, le module pent th~o- 
riquement ~tre ~tendu pour comprendre plus de deux langues et cons- 
truire les expansions complexes de ce qulAndreyev a appel~ "anneaux 
de traduction" \[ANDREYEV (1965)\]. 
Depuis la publication de cet article, rien n'a chang~ dans 
le statut formel des z-mots; en ce qui concerne le traitement, tou~ 
tefois beaucoup de changements ont eu et ont encore lieu. Pour gar~ 
dernos chances des respecter les d6lais de notre contrat, nous 
avons r~duit la pottle de notre module. Pour le langage source, il 
nous faut nous preparer ~ accepter autant que possible du vocabulai- 
re anglais - si nous ne voulons pas restreindre notre syst~me ~ une 
classe ~troite de textes techniques - Par contre il nous suffira 
pour le moment d'utiliser g la synth~se une portion bien plus r6dui, 
te du vocabulaire fran~ais. Dans l'exemple ci-dessus, cette res- 
triction temporaire nous permet de nous dispenser de deux des trois 
r~alisations franqaises de "zrespectfully ~. Nous avons de plus ac~ 
cept~ une hypoth~se suppl~mentaire: qu'il existe un vocabulaire 
"de base" du fran~ais, servant ~ exprimer routes idles communes, et 
qu'il suffit d'enrichir de micro-glossaires techniques pour per~ 
mettre une traduction des textes anglais. Autrement dit, un vocabu~ 
laire correspondant au Basic English. Nous avons la chance de pos~ 
s~der une bonne approximation d'un tel vocabulaire dans les deux 
livres Le Franqais fondamental (F.f.) \[GOUGENHEIM (s.d.)\], Jus- 
qu'ici \[a technique la plus rapide que nous, ayons trouv6e pour la 
compilation du dictionnaire est la "traduetion ~ rebours" du F.f. 
vers l'anglais. 
18 
Nous avons consid~r~ diverses mani~res dt~tiqueter la 
fonction ZWORD. Les semoglyphes d'Andreyev devaient 6tre num~- 
riques. Mais nous n'avons pas accept6 l'id~e d'un langage pi- 
vot qui ne serait pas directement lisible par les linguistes 
qui l'utilisent. Au d6but, nous utilisions des mots fran~ais 
que nous distinguions du vocabulaire du fran~ais proprement 
dit par le pr~fixe "z" (D'o~ le terme "z-mot"). R~cemment, 
nous avons adopt6 un ~tiquetage dont les symboles sont plus 
longs, mais plus explicites. Ayant 6tabli un "ensemble de 
synonymes" anglais, nous attachons une ~tiquette anglaise 
cet ensemble. Cela est ais~, puisque nous avons un bon diction- 
naire anglais des synonymes qui donne une ~tiquette convenable 
pour chaque collection de synonymes \[LEWIS (1981)\]. Du cSt~ 
fran~ais nous n'avons pas de collections de synonymes pour le 
moment, mais un seul lex~me F.f.. Le z-mot est compos~ par 
composition de l'6tiquette anglaise avec le lex~me F.f. Par 
exemple, certains usages de "give up", "renounce", "surrender", 
"abandon", etc., sont tous couverts par l'~tiquette RELINQUISH 
dans le dictionnaire de synonymes, et tous traduisibles par 
'abandonner', lex~me P.f. . Nous composons donc un z-mot 
"zrelinquish/abandonner", pour marquer la 'variable de traduc- 
tion' dont les valeurs sont les mots cit6s ci-dessus. Par la 
suite d'autres valeurs, synonymes de "abandonner" seraient in- 
troduites. 
Nous avons conscience d'un certain danger: en op6rant par "tra- 
duction ~ rebours" ~ partir des lex~mes F.f. nous pourrions avoir 
des difficult~s si le F.f. contient d6j~ des synonymes: une collec- 
tion de synonymes anglais pourrait se trouver marquee de plusieurs 
z-mots diff6rents; cela cr6erait de l'ambigu~t6 dans le langage 
pivot, ce que nous d6sirons vivement 6viter. Si une telle ambigu~- 
t6 apparaSt, nous aurons ~ raffiner la notion de z-mot pour l'61i- 
miner. Mais nous avons d6j~ introduit des raffinements, puisque 
nous conservons dans le pivot, outre les z-mots, les 616ments 
6tudi6s plus bas, soit: SEMANTIC PARAMETERS, STYLE~ ATTITUDE, 
THESAURUS CATEGORY. 
Par la mani~re dont les z-mots sont produits, nous obte- 
nons une d~finition op~rationnelle de la valeur cognitive des lex~- 
mes du pivot. Chaque collection de sens de lex~mes constitue ce que 
Sparck Jones, dans son ouvrage sur les synonymes anglais, appelle 
un "row"; nous consid~rons que nous avons ~tendu son module ~ la 
traduction lexicale ou, disons-nous, ~ la "synonymic interlinguale" 
\[SPARCK JONES (1965) \]. 
19 
2. SEMANTIC PARAMETERS 
Certains membres de l'6quipe de recherche aimeraient 
adopter une approche plus analytique dans la d~finition du voca* 
bulaire pivot \[cf. section IIi.2\] et ce groupe de param~treS peut 
~tre consid6r6 comme un pas dans cette'direction. Mais l'id~e de 
ce type deparam~tre, que 'Melchuk a 6tudi6e en d~tail \[MELCHUK 
(1967).\] n'a 6t~ jusqu'ici adopt6e chez nous qu'avec des restric- 
tions. Melchuk fair l'hypoth~se que ces param~tres sont des uni- 
versaux: nous ne les introduisons que lorsqu'ils sont justifies 
ouvertement par des synonymes ou des t raductions. Ainsi dans les 
exemp-les suivants: . 
("causatif") (i) Eng. inform -- Fr. faire savoir 
(ii) Eng, inform -- Eng. le__t_tknow; 
("inchoatif")(iii) Eng. o~_o_t_osleep -- Fr. s'endormir, 
les 616ments soulign6s sont une justification acceptable de la 
pr6sence'du param~tre en question. 
3, STYLE et ATTITUDE 
II s'agit-respectivement de "niveau de style" et de "juge- 
ment port6 par le locuteur sur l'information cognitive qu'il 
transmet". Nous pensons que ces deux 616ments font pattie de la 
"signification" totale d'un lex~me puisqu'elles sort refl6t6es 
dans le choix du locuteur parmi des lex~mes comportant la m~me va- 
leur cognitive. Nous sommes conduits ~ cette extension de "signi- 
fication" d~s que nous voulons de bonnes traductions. Nous recon- 
naissons par exemple la diff6rence entre "in future" (familier) 
et "henceforth" (rh~torique); ou entre "leave one's country" (at- 
titude neutre) et "abandon one's country" (attitude de condamna- 
tion). 
On peut se demander s'il existe des synonymes templets. 
Ainsi, lorsque l'on groupe des synonymes pour la traduction il 
est important de pouvoir d6crire d'une part la "pattie du sens" 
qui cr6e synonymie, et d'autre part la "pattie de sens" qui dis- 
tingue des synonymes partiels. La synonymie, pensons-nous, est 
fond6e sur le contenu cognitif des lex~mes, tandis que STYLE, 
ATTITUDE et THESAURUS CATEGORY (voir ci-dessous) sont des param~- 
tres de diff6rentiation qui peuvent rendre une synonymic partiel- 
le sans la d6truire enti~rement. 
20 
4. THESAURUS CATEGORY 
I1 nous faut situer chaque usage d'un lex~me dans un 
thesaurus structur6. Comme d'autres avant nous en T.A., nous nous 
sommes adress6s ~ Roget, ou du moins ~ une collation moderne de 
son magnum opus \[MAWSON (1946)\]. Sa hi6rarchie date du 19 e si~cle, 
et au moins en pattie est extra-linguistique et refl~te une 6poque 
et une culture donn6es. Elle est toutefois utile pour une descrip- 
tion partielle des contextes d6terminants pour les polys~mes, et 
m~me pour la reconnaissance des 616ments principaux ("actants") 
dans notre grammaire de d6pendance. La distinction th6orique jus- 
tifi6e entre "facteurs linguistiques" et "facteurs culturels" dans 
la production du langage est trop vague pour 8tre marqu6e en pra- 
tique. 
Malheureusement, il nTy a pas de correspondant fran~ais au 
Roget, et nous n'avons pas les ressources et le temps pour compi- 
lerun nouveau thesaurus. 
S. SYNTACTIC CATEGORY et REGIME 
Ces d6tails n'apparaissent pas en ligne 4, c'est-~-dire 
qu'ils ne sont pas "persistants" dans le pivot. Les lex~mes du pi- 
vot ne comportent pas d'indications syntaxiques, car un concept 
exprim6 en anglais par un verbe, par exemple, peut se trouver ex- 
prim~ par un nom en fran~ais, etc. Mais d'autre part, les r6alisa- 
tions lexicales en anglais ou fran~ais doivent ~tre class6es en par~ 
ties du discours pour que la syntaxe puisse 8tre trait6e. De plus, 
il nous faut attacher ~ chaque lex~me la description des structures 
qu'il peut gouverner. Nous Voposons le terme REGIME pour d6noter 
ces structures. Jusqu'ici, nous n'avons 6labor6 la description 
ad6quate des r6gimes que pour les verbes et leurs "actants" (selgn 
Tesni~re et le CETA, avec des modifications). Mais la partie 
lexicographique permet l'61aboration future de la description des 
r6gimes pour les autres parties du discours. 
Nous avons trouv6 que les r~gles syntaxiques peuvent sou- 
vent s'appliquer ~ des cat6gories de thesaurus d'un niveau 61ev6 
clans la hidrarchie de Roget. Par exemple, il y a des formes de 
phrases caract6ristiques des verbes de "communication humaine". Ces 
trouvailles sont importantes pour l'6conomie des grammaires, puis- 
qu'elles tendent ~ confirmer l'hypoth~se que la syntaxe n'est pas 
ind6pendante de la s6mantique. 
21 
La description d'un r~gime a un but double: en plus de son 
utilit~ dans l'analyse de la phrase, elle constitue un contexte 
g~n~ralis~ sp~cifiant un certain usage d'un lex~me. Nous nous ef- 
for~ons donc de g~n~raliser de la sorte tousles contextes particu- 
liers - c'est-~-dire les citations - que notre dictionnaire de base 
\[HARRAPS (1967)\], nous offre. Nous n'avons pas assez de place ici 
pour ~tudier le d~tail des sous-param~tres commandos par REGIME. 
En conclusion, remarquons qu'il est tr~s bien d'~crire une 
grammaire explicitant les relations entre les concepts d'une phrase 
ou d'un texte, mais que la moiti~ seulement du travail de T.A. est 
faite rant que les concepts eux-mSmes ne sont pas formellement d~fi- 
nis. 
VI- GRAMMAIRE D'ANALYSE DE L'ANGLAIS 
La phase de consultation lexicale fournit ~ l'entr~e de la 
grammaire d'analyse une s6quence de mots du langage pivot assortis cha- 
cun d'une ou plusieurs categories gr~aticales. La sortie de la gram- 
maire d'analyse est une s~quenee - munie d'un ordre hi~rarchique - de 
mots du langage pivot qui repr6sente les d6pendances s~mantiques de la 
phrase d'origine. Ii y a une eorrespondance biunivoque entre les confi- 
gurations s~mantiques et les chaTnes du langage pivot. Par consequent 
les paraphrases seront repr~sent~es par une mSme chaTne du langage pi- 
vot, et les phrases n-ambigu~t~s auront n representations dans le fan- 
gage pivot. 
Les r~gles de la grammaire sont de deux types fondamentaux: 
I. R~gles qui assignent une cat~gorie grammaticale 
sup6rieure ~ une s6quence de categories gramma- 
ticales. 
2. R~gles qui permettent, effacent ou ajoutent des 
~16ments dans une s~quence. 
Dans le formalisme Wces deux types de r~gles apparaissent dans deux 
parties s~par~es de la grammaire, 
Les r~gles du type 1 effectuent une analyse en constituants 
i~diats de la cha~ne d'entr~e (ou de r~arrangements de celle-ci effec- 
tu~s par des r~gles du type 2.) Pour qu'une chaSne pivot r~sulte de ce 
traitement, il est n~cessaire que la cat~gorie "phrase compl~te" soit 
attribute ~ la chaSne d'entr~e dans son ensemble. Les r~gles de type 1 
22 
"essaient" d'assigner une cat6gorie ~ chaque sous chaSne de la 
cha~ne d'entr~e, mais seules seront conserv~es les attributions 
de categories eonduisant ~ 1'attribution de la cat6gorie "phrase 
complete" ~ la chaSne d'entr~e. 
Les r~gles de type 2 ont deux fonctions. La premiere est de norma- 
liser la representation de variantes transformationnelles, qui se- 
ront ainsi repr~sent~es par la m6me chaSne pivot. La seconde est 
de r~arranger les parties d'une chaSne selon un ordre hi6rarchique 
et d'introduire des ~16ments de parenth~tisation et d'~tiquetage. 
La grammaire actuelle a des r~gles sp~cifiant les 
structures possibles des composants syntaxiques principaux: groupes 
nominaux et verbaux, phrase, adjonctions. I1 y a aussi des r~gles 
sp~cifiant des restrictions d'ordre s~mantiques entre les composants 
principaux. Pour le moment celles-ci sont assur~es par un systSme 
d'accords entre le verbe et ses actants. 
Les structures de constituants d~crites par notre gram- 
maire sont en constante expansion. Certaines des structures princi- 
pales d6crites sont les suivantes: adjectifs, d~terminants, propo- 
sitions relatives, modifieurs pr6positionnels, adverbes (d'un seul 
mot), modaux, auxiliaires, circonstanciels, etc. Les r~gles de type 
• 1 donnent en gros l'analyse suivante: 
The young reporter can ask the minister a quesZion tomorrow . 
A I N \[ ~ ID N IlP N Adv 
AP \] VP NP NP 
NP 
S 
S + Adv 
Phrase complete 
23 
Dans l'analyse les r~gles de type 1 s'appliquent non seu- 
lement ~ la chaYne d'entr~e mais aussi au r~sultat de iV application 
de r~gles du type 2. Le diagramme precedent n'est donc qu'une approxi- 
mation du traitement r~el. \[Pour un exemple d'analyse montrant les r~- 
gles utilis6es ~ chaque 6tape voir RAPPORT SEMESTRIEL (1969)\]. 
Les accords quasi s~mantiques sp~cifiant les restrictions de cooccur- 
fence entre un verbe et ses actants nous permettent d'~liminer certains 
cas d'ambigu~t~ syntaxique. Par exemple nous pouvons ainsi choisir des 
structures diff~rentes pour: 
The witness to the accident that occurred at the corner 
et 
The witness to the accident that spoke to thereporter s 
Les r~gles du type 2 qui 61iminent les variantes paraphras- 
tiques le font par r~criture des variantes en une m6me cha~ne. Ainsi, 
les variantes: 
The man to whom I gave it 
The man whom I gave it to 
The man who I gave it to 
The man that I gave it to 
sont toutes r~crites dans la mSme forme canonique, et trait~es ~ par- 
tit de ce moment de la m6me fa~on. De cette mani~re, les variantes 
syntaxiques sans signification s~mantique ne sont pas conserv6es jus- 
qu'~ la cha~ne en langage ~vot. 
VII - SYNTAXE FRANCAISE 
Le but de la g~n~ration du fran~ais est dlobtenir une 
expression adfiquate des structures s6mantiques cod~es dans les cha~- 
nes du langage pivot, qui soit aussi proche que possible du fran§ais 
(technique) standard. II est ~vident que les raffinements stylistiques 
ne sont pas encore - et ne seront pas pour longtemps - ~ l'ordre du 
jour. 
! 
24 
Nous recherchons essentiellement qu'une forme correcte de 
l~expression, on peut diviser la t~che en trois parties. Le fran§ais 
comporte des marques dtaccord obligatoires et certaines contraintes 
d'ordre des ~l~ments. De plus, il faut g~n~rer les formes correctes 
des lex~mes pourvus de leurs marques grammaticales. 
Nous avons da pour cela diviser la g~n~ration du fran~ais 
en quatre phases. 
La premiere (I) d6tache de la structure s~mantique cod~e 
dans les cha~nes - pivot les 61~ments abstraits codant les lexDmes, 
et les remplaee par des ~x~mes fran~ais accompagn~s de leur marqueurs 
grammaticaux inh~rents (genre du nom, classes s6mantiques et pr~posi- 
tions r~gies par le verbe, etc.) 
La seconde (II) effectue une recomposition de la structure 
s~mantique et une copie des marqueurs introduits en phase I en toutes 
les positions off ils sont requis par les r~gles d'accord du fran§ais. 
La troisi~me (III) donne aux 61~ments l'ordre de surface 
du fran§ais. L'importance de cette phase est r6duite dans une grande 
mesure par la d~cision de n~gliger pour l'instant toutes sortes de 
d~tails secondaires. C'est sur elle que nos efforts futurs devront 
porter si nous voulons am61iorer la fid61it6 "stylistique" de la tra- 
duction. 
Nous pr~voyons la n~cessit~ d'une quatri~me phase s6par~e 
de la troisi~me. Cette phase IV serait proprement appel~e "morpholo- 
gie". Elle correspond grossi~rement ~ la partie phonologique d'une 
graranaire g~n~rative, et n'est pour l'instant repr~sent~e que par 
quelques r~gles plac6es "en appendice" ~ la phase III. Des travaux 
effectu~s il y a quelques ann6es par A. Dugas serviront de base ~ un 
traitement relativement simple de la morphologie. 
VIII - SYSTEME-Q 
A la lumi~re des experiences pass6es, il est apparu que 
le module math6matique de traduction que nous utilisions (grammaires- 
W) pr6sentait certaines lacunes: 
1. Difficult~ de fractionner la phase d'analyse 
ou de ~6n6ration en plusieurs phases. 
2. Manque de souplesse pour manipuler certaines 
informations structur6es sous forme d'arbre, 
en partieulier lors de la phase de g~n6ratien. 
*,,~ #,1 u 
" " ®~ T 
~'~ ,~", 
I ! 
.o~ ~~ 
• -I ,~ 0 
~ h 
25 
I 
26 
5. Performances limit~es quant ~ la taille des 
grammaires accept~es et du temps d'ex~cution 
des programmes. Ce dernier d~faut d~coule 
d'ailleurs directement des d~fauts 1. et 2. 
A. Colmerauer a donc commenc~ l'~tude d'un nouveau type de 
grmmaire plus adapt~ au but que nous nous proposons d'atteindre. Ces 
grammaires (syst~mes-Q) seront essentiellement constitu6es de r~gles 
de r~6criture g~n~rales pouvant non seulement s'appliquer ~ des cha$- 
nes mais aussi ~ des arbres. Un programme est en cours d'61aboration, 
qui permettra 6tant donn~ un texte ou une information structur~e 
sous forme d'arbre, de lui appliquer un certain nombrede transforma- 
tions d6crites par une grammaire et d'obtenir un nouveau texte ou une 
nouvelle information structur~e. En utilisant plusieurs lois ce m6me 
programme avec des grammaires diff~rentes, on pourra alors enchaSner. 
plusieurs phases d'analyse de l'anglais et plusieurs phases de g~n~ 
ration du fran~ais. I1 faut remarquer que, contrairement aux grammai~ 
res W, ce sera le mSme programme qui sera utilis6 pour l'analyse et 
la g~n6ration. Ceci donnera plus de possibilit6s aux linguistes ~cri- 
vant les grammaires: en effet, nous nous sommes aper~us que durant la 
phase d'analyse il ~tait parfois n~cessaire d'utiliser certains pro- 
cessus propres ~ la phase de g~n~ration et inversement durant la pha- 
se de g6n6ration, de r~analyser certaines parties afin de v6rifier la 
grammaticalit~ du fran§ais g~n~r6. 
Nous avons d6j~ commenc6 l'6criture d'une partie de ce 
nouveau syst~me, qui est op~rationnelle depuis juin 69. Acette date, 
nous avons donc pu commencer l'~tude de la traduction automatique 
une plus vaste ~chelle. Les gra~maires-W qui sent d6j~ 6crites seront 
tr~s facilement r~utilisables, le nouveau formalisme ~tant surtout 
une extension de ce que nous avons fair jusqu'~ maintenant. 
IX - ESQUISSE D'UN SYSTEME DE TRADUCTION 
Les procedures de traduction d~crites dans les sections 
pr~c~dentes comportent un certain nombre de limitations. Celles-ci 
nous ont conduits ~ examiner quelles seraient les extensions n6cessai- 
res de notre syst~me. La figure 5 indique les types de traitement dent 
nous pr~voyons la n~cessit6, ainsi que l'organisation du traitement. 
Paute de place, nous ne ferons pas de commentaires sur les parties qui 
sent d~j~ en cours de d~veloppement et n'ont qu'~ @tre adapt~es au sys- 
t~me, par exemple 9: Programme d'analyse syntaxique. Nous ne parlerons 
donc que des sections qui en sent encore au stade th~orique, mais pour 
lesquelles nous entrevoyons une r6alisatien possible, par exemple 5: 
Analyse de texte. 
1. £ntr6e du texte entier 
27 
Le traitementactuel se fair: phrase par phrase; le sys- 
tame pr0pes~ tiendrait compte de ce que l'analyse s~mantique n'est 
possible qu'~ partir d'un texte entier et non de phrases isol~es. 
2. Recherche daus un lexique s~mantiquement structur~ selon le prin- 
cipe de correspondance maximale 
Le lexique propos~ assignera aux cha~nes dVentr~e des 
ensembles de marqueurs s~mantiques et syntaxiques (ces cha~nes ne 
seront pas limit~es ~ des mots isol~s). La sortie du lexique, pour 
une chaSne donn~e comporterait l'ensemble de ces marqueurs. Les sor- 
ties du lexique actuel sont constitutes de mots du langage pivot 
assortis de tels marqueurs \[cf. section V\].-Au niveau de la phrase, 
un lexique s~mantiquement structur~ nous permettrait d'~liminer les 
sens de la phrase satisfaisant aux r~gles de la syntaxe, mais non 
celles de la s~mantique. Au niveau des relations entre phrases, il 
nous permettrait d'~tablir des relations entre les domaines s~man~ 
tiques de diverses parties du texte. 
3. et 4., 14. et 15. Programmes palliatifs 
Ces programmes permettent de produire un r~sultat dans 
les cas o~ le syst~me ne pourrait pas traiter un ~l~ment lexical 
ou syntaxique. 
5. Programme d'analyse de texte 
Ce programme comportera des r~gles concernant les rela- 
tions entre les phrases d'un texte. Celles-ci assureront la coheren- 
ce du texte dans son ensemble. Parmi les t~ches sp~cifiques que ce 
programme pourrait assurer, citons: 1. Clarification des r~f~rences 
pronominales. 2. D~sambiguation des ~l~ments dWune phrase dVapr~s 
d'autres ~l~ments du texte. 5. Restauration de portions ~lid6es du 
texte (par exemple restitution de 1'agent effac~ d'un passif). 
On peut pr~voir deux niveaux de r~gles diff~rents: 
1. Celles qui agissent sur des traits s~mantiques pour 
~liminer des ambigu~t~s ou ~tablir des relations 
d'inclusion . 
2. Celles qui traitent des interd~p~endances syntaxiques 
entre les phrases d'un mSme texte. 
28 
6., 10. et 11. Options de recyclage 
On peut s'attendre que la complexit~ des relations entre 
choix lexical, structures de phrase et structures de texte requi~re 
parfois un traitement cyclique. 
17. et 18. R6duction des chaSnes pivot 
Ce programme choisirait entre divers sens possibles qui 
n'auraient pas ~t~ ~limin~s par les progranunes precedents, pour ~vi- 
ter la production de multiples traductions. 

REFERENCES 

ANDREYEV (196S) : Andreyev, N. 'The intermediary language as 
the focal point of machine translation I , 
in A.D. Booth (ed.), Machine Translation, 
Amsterdam: North Holland Publishing, pp. 
1-27. 

DE CHASTELLIER 
et COLMERAUER 
G. de Chastellier et A. Colmerauer, IW- 
Gramar', paper to be read at the 1969 ACM 
National Conference and Exposition, Aug, 
26-28, San Francisco. 
(1969) : 

GOUGENHEIM 
(1954) : 
Gougenheim, G.~ et al., Le Franqais fonda- 
mental, i er et 2 e degr6s, Paris: 
S.E.V.P.E.N. 

HARRAPS 
(1967) : 
Mansion, J.E., Harraps Shorter French and 
English Dictionary, revised edn. by Ferlin 
and Forbes edited by D.M. and R.P.L. 
Led~sert, London: Harrap. 

HARRIS 
(1968) : 
Harris, 8., 'Entit~s lexicales abstraites 
de traduction', Recherche sur la tradue- 
tion automatique, rapport trimestriel, x, 
51 avril 1968, 16-54. " 

HOFMANN 
(1968) : 
Hofmann, T.R,, Affixation-a new direction 
in transformational theory, Washington: 
ERIC/PEGS, July 18, PEGS Paper No. 55. 

LEWIS 
(1961) : 
Lewis, N. (ed.), The New Pocket Roget's 
Thesaurus in Dictionary Form, New York: 
Washington Square. 

MAWSON 
(1946) : 
Mawson, C.0.S., et Whiting, K.A. (eds.) 
Ro~et's Pocket Thesaurus, New York: 
Pocket Books. 

MELCHUK 
(1967) : 
Mel'cuk, I.A., 'Semanti~eskie parametry 
....... ', in To Honor Roman Jakobson: 
Essazs on the Occasion of His Seventieth 
Birthday, Hague: Mouton, pp. 1340-1361. 

RAPPORT 
SEb~STRIEL 
(1969) : 
Projet de Traduetion Automatique, 
semestriel, 12, Montreal: Universit6 de 
Montreal et Conseil National de Recherches 
du Canada, 31 avril. 

SPARCK JONES 
(1965) : 
Sparck Jones, K., 'Experiments in semantic 
classification', Mechanical Translation, 
viii, 3 and 4, Juno and Oct.~ 1965. 
