LES GRAMi~AIRES DE CONSTITUANTS GENERAUX. 
par R. D. GuedJ. 
I1 est deux faits linguistiques dWune grande importance qui 
nous ont conduits ~ d~finir un nouveau type de gra.maire formelle9 les ? 
Er~mnaires de constituants g~n~raux (GCC)z 
- la presence dans les langues naturelles de mots non connexes 
- la distinction entre le niveau de In composition et le niveau de 
ltexpression dana la g~n~ration ou la reconnaissance dlune phrese. 
o.1 . conn  es. 
Si nous voulons analyser une phrase ~ussl simple que 
" the boy switches the llght off " 
En tout premier lleu nous pouvons dire que cette phrase eat £orm~ep dans 
ltordre~ d'un article~ dlun substantif, d'un verbe, d'un artlcle, dtun 
substantlf, d'une postposition; Cependant 11 est bien clair que le verbe 
swltches et la postpositlon off sont intime~ent li~s pour former le verbe 
switches off, un tel mot sera appel~ mot non connexe ~ deux insertions. 
Les GCG vont nous permettre d'accepter des mots non connexes 
. ,.. . 
...... ~ plusieurs insertions con~e des entlt~s; crest ainsl que l'on repr~sente 
: un mot ~ 2 insertions par le llen qul unit les deuxpartles qui le 
constituents 
i 'i 
switches off 
(que 1'on appellera aussl peiEne ~ deux dents). 
0.2. Expression et Composition. 
II est un fair essentiel sur lequel nous nous permettrons 
dWinsister d~s ~ present. Dans la g~n~ration ou la reconnaissance d'une 
phrase nous distinguons deux niveaux: le nivaau de l'expression et le 
niveau de la composition. Tout d'abord un example choisi hors du 
domaine linguistique nous permettra de rendre plus clair cette distinction. 
Lorsqu'une entreprlse d~slre construire un imeuble de n appartements 
e~le a, au pr~alable~ constitu~ un stock de briques, de sable, de tulles, 
de verre, de bois,.., c'est ce stock do mat~riaux qua nous appelons la 
composition de l'Inaneubla. Puis l'architecte utillse les ~l@ments qui 
constituent ce stock~ur batir un immeuble. Cependant il pourra 
disposer les appartements de mani~res diff~rentes, et c'est la disposition 
des appartements que nous appelons l'expresslon de l'imeuble. Ainsl 
deux immeubles peuvent dif~rer au niveau de la composition (par la 
nature ou l'importance du stock) et de plus ayant m~me compostions il 
peuvent diff~rer par l'expression (par la disposition des appartements). 
Revenons ~ notre objet~ en llngulstique ces deux niveaux apparaissent 
clairement. Au niveau de !a compostion nous nous bornons & ~noncer les 
types syntaxiques n~cessaires ~ la formation d'une phrase (remarquons 
qua l'ordre dans lequel nous les disposons a peu d'importance Ici). 
Au niveau de l'expresslonp nous commen~ons par donner des valeurs aux 
dlff~rents types syntaxiques de la liste fournie par la composition (ces 
valeurs pouvant ~tre des mc~s ~ plusieurs insertions), ensu!te nous 
indiquons la disposi~Lo~ relative de ces mots, Dans le cas de mots non 
connexes il s'agit d'i~briquer les peignes qui repr~sentent ces mots, 
avec l'alde des '~orphSsmes de pelsnes". 
- 2 - 
Dans cet article nous donnons la d~finltion de la cat~gorie 
8EG, des arbres blordonn~s et des GCG, cette derni~re d~finitlon 
suppose connues les notions fondamentales de la th~orle des cat~gorles. 
Ensulte nous donnons une propri~t~ alg~brique des langages engendr~s 
par les GCG, qui nouspermettra de les comparer aux types de grammaires 
d~J& exlstants. 
§ I. CATEGORIE SEG. 
I.I. Simplexe. Solt k E ~. On appellera simplexe k (not~ k ): 
on le repr6sente aussl pmr le peigne ~ k dents 
k 
i i Ii 
1.2. Simplexe segment~. On appelle simplexe segment~ une suite de 
simplexes. 
On appelle pzoduit des simplexes se~aent~s S I ,...t S nle 
s~anplexe segmentd repr~sentd par le pelgne obtenu en juxtaposant de 
gauche ~ droite les pelgnes qul repr~sentent successivement S t ..., S n 
(que 1'on note S = i = i .*.. n Si) 
Ex= 
s I = ~ 
S 2 ; l i l" 't 
%*s 2 • i--I ll i i I I- I 
1.3. Morphismes. de peignes, o ~ ~ io -.~ 
Soit un simolexe segment~ (source) un morphisme de peignes 
-3- 
assemble les peignes qui constituent ce simplexe segment~ (8raphe 
pour construi~e un nouveau simplexe segment~ (but). 11 nous faut done 
pr~ciser comment les peignes de la source sont assembl~s pour former les 
peignes du but. 
Exz le morphisme ~0 : 
\ 
~0 ~}~ butgraphe 
la source , ~o est le simplexe segment~ compos~ dans l'ordre d'un peigne n i 
~tzols dents et d'un pelgne n 2 ~ deux dents. 
le graphe de ~0 indlque que I'on insure la premiere dent du peigne n 2 
entre la 1 ~re et la 2 ~me dent du peigne n Iet que lyon insure la 
deuxi~me dent du peigne n 2 entre la 2 Ame et la 3 ~me dent du pei~ne n I . 
le but de ~ est un peigne ~ 2 dentsj la premi&re est fortune, darts 
10ordre9 par la I ~re de n Iet la 1 ~re de n 2 ~ la deuxi~me par la 2 ~"ne 
de n I p la 2 ~me de n 2 et la 3 ~me de n I ( on zetQurne le pelgne du but 
pour marquer plus clairement la mani~re de I Vobtenir}. 
1.4. Composition de morphiy~eso 
Soit deux mor~hismes ~ et ~ tels que source ~ ~ 
on d~finit le morphisme ( ~ o ~ ) de la mani~re sulvante: 
source ( ~ o ~ ) = source ~ 
but ( w o ~ ) = but 
et 8raphe de ( ~ o ~ ) est d~duit de graphe ~ et 8raphe ~ de la manl~re 
que rendra clair i'exemple m leant: 
est le morphisme d6fini plus haut 
-4-- 
est le morphisme 
alors ( W o ~0 ) est le morphlsme.- 
i V-7 
L_J 
1.5. Cat~Korle SEG. 
La. cat~gorie SEO est une cat~gorle/b prodult direct dont 
les obJets sont les ~mplexes segment,s, lee £1~ches sont lee morphismes 
de peignes et le composition des £1~ches est la composition des 
morphismes de peignes. 
J § 2. ~BRES ~!O~XDONNIrS. 
2.1. D~£inltion. 
Un arbret~ordonn~ est un ensemble .~£1ni munl de deux relations 
dlordre:~ (ordre hi~rarchlque) et ~ (ordre s~quentiel) assujettles 
aux conditions suivantes~ 
A I 
'A 2 
A 3 : V 
A 4 ~ V 
: le pr~d~cesseur imm~d£at pout ~ de tout ~l~ment de ,~/~ lorsqu.°il 
~xistep est unique. 
• ~ est une relatlon dtordre totalo 
A, ~ e ~; CA,B> ~ ~CA,B> 
A, A t , B, B' E ~.~, 
Un ~l~ment sans pr~d~cesseur pour est appel~ sommet de un arbre 
biordonn6 qUL admet plusieurs sormuets est dit non connexe. 
2.2. Listes. 
Etant donn~ un ensemble fini (l'alphabet), on appelle liste 
sur Ale couple (~ ~ ) d'un arbre biordonn~ et d'une application ~tique- 
tage ~ de ~# dans le monolde libre construit sur A. 
Exemple: $oit l'arbre biordonn~ suivant, les nombres attaches ~ chaque 
noeud sont leurs num~ros dens l%rdre ~: 
3 4 5 7 8 
et soit l%lphabet A = {Europe, France, Italie, Afrique~ Soudan, Niger, 
Rome, Pise, Dijon, Paris, Marseille } 
et ~ (I) Europe, ~(2) = France, ~(3) = Parts, ~(4) = Dijon, 
~(5) = Marseille, ~(6) =Italie, ~(7) = Rome, 6(8) = Pise, 
~_(9) = Afrique, ~(I0) = Soudan, ~(~I) = Niger 
\.. 
Paris Dijon Marseille Rome 
italie 
~urope 
Pise 
~ iger 
§3. GRAMI, L~IRES DE CONSTITUANTS GENEiLAUX. 
Une GCG est la donn~e du 5-upple sulvant: 
- ~ - 
Its 3 premieres composantes cou~ti~uent la composition et Its trois 
derni~res contituent lWexpression. 
g,. 
: ensemble fini appel~ alphabet nontez~ainal ou alphabet d'es categories 
syntaxiques (dont les ~l~ments sont notes par une capltale latine), ~ 
comprend un ~l~nent distingue, It~l~ment initial S. 
~: ensemble fini de r~gles syntaxiques r, muni de deux applications 
source et ~ but : 
une r~gle r sera notre aussit 
~(r) r : ~(r) ----->~(r) ou r~(r) 
~: ensemble fini de r~gles lexicales t, muni d~une application ~* butp 
VA E ~ on d~finit l'ensemble ~A : 
~ventuellement un ~A peut ~tre vide. 
Soit~ I timage par ~t de ~, crest I tensemble des categories 
syntaxiques auxquelles on fera correspondre dans l~expression, ~ Itside 
de !tapplication source ~v de ~ une expression terminale. 
Disons maintenant quelles sont Its constructions ~labor~es 
au niveau de la composition. 
On d~finit une cat~gorie avec produit tensoriel SYN qui a 
pour obJet Its mots du mono~de ~ ~ le produit des objets nt6tant autre 
que le produit de juxtaposition du mono~de. Les morphismes de SYN sont 
- 7 " 
consZa~las ~ p~rtir du syst~me f~ de mo~ismes g~n~rateurs. 
Pour B 6 ~ et A 6 , Soit HOmsYN(A,B) l'ensemble des morphlsmes de 
^ 
SYN ayant A pour source et B pour but, cet ensemble nVest autre que 
^ 
l'ensemble des arbres biordonn~s de son=net Bet de base Ap construits 
en prenant pour liens les r~gles de 9~ ( ~ chaque noeud de l'arbre 
correspond une lettre de ~ , ~ cheque noeud non sltu6 ~ ia base 
correspond un~ r~gl~ de f~ dont le buz est la lettrc ~u no~ud ct dont 
la source est le mot de ~ form~p dans l'ordre s~quentielp par la suite 
des lettres des noeuds imm~diat~aent inf~rieurs). 
Un 61&nent s~ £ Hom SYN(A,B) est appel6 un schema de synta~me 
de type B (eonstrult~. partlr de A)o Dans la termlnologie classique s~ 
^ 
serait la donn~e d'une certaine B-d~rivation de A. 
^ 
On d~flnit ensuite un syntasme compos~ de type B, (s~ , t) 
^ 
coulne un couple d~un schema de syntagme de type B~ et dlun mot t E ~* 
tel que 8'(t) = A, ¢'est-~-dlre qu'un shh~ma de syntagme de type B ne 
peut permettre la construction dXun syntagme ¢ompos~ de type B que si 
^ 
Un syntagme compos~ de type B pourra aussi ~tre notre sA(t)o 
Nous supposerons icl que la cat~gorle ~'expression est touJours 
SEG. 
\[ ~ ~ = L ~ * .... , I~ ~ alphabet terminal gradu~. 
: ensemble des mots terminaux ~ i-insertions. On consid~re le 
o, de <ou  o.eUe libre) construct sur \[ \] 
• foncteur de SYN dans SEG commutant ave le produit tensoriel. On 
d~signe par ~(A) l'entier strlctment positif, nombre dOinsertions de 
-8- 
l'ex\[xressiqn des syntagmes de cat~gozle syntaxique A. On ddslgne par ~(r) 
le morphisme de SEG correspondant ~ la r~gle r : ~(r) aura pour but 
le pelgne ~ ~(~(r) ) dents et pour source la liste de peignes ~ ~(A i) 
dents ( si or(r) = A 1 ... A n ). 
~ ' } qui envoient ~A dans ~' : est une famille d'applications ~A A 6 AN 
T)g(A) (A* , ¢lest-~-dire que ~ chaque terme on fait correspondre un mot 
ayant le nombre d'insertlons convenable... 
On d~finit maintenant un syntagme exprlm~. Soit un syntagme 
^ ^ 
compos~ SBA(~), c~' assoeJe ~ t, consid~r~ cormne liste de termes tl, une 
llste mots ~ plusieurs insertions ot'(t i) 
avec V i ~'(t i) E (~)~(8'(ti) ) 
,ttr la llste {~'(ti) } Qp~re lemorphisme de SEG~(s~)ler~sultat de 
cette operation sera un~ syntagme exprim~de t3~peB, expression du synta~c 
^ ^ 
compos~ s (t). On pourra dcrire ce syntagmee~p~ ~(s ) w(t) . On 
note ~B IIensemble des syntagmes exprim~s de type B, en particuller ~S 
sera le langage engendr~ par la grammaire de constltuants g~ndraux 
L(~) = ~S 
et sl ~(S) = I on a t(~) c ~ 
On remarque qutun m~me syntagme exprim~, peut ~tre l'expresslon de plus 
syntagmes compos~s~ c'est pourquoi on d~finit l'ambiguit~ de structure 
d'un syntagme exprim~ ~(s A) <~'(t))comme le cardinal de 1'ensemble" 
^ 
si Iron caract~rise les r~gles de types CF corme ayanttmmembre de gauche 
appartenant ~ A Net non ~ , on peut consld~rer les GCG cormme des granmnalres 
- 9 - 
de type CF plus g~n~rales puisque V r 
~,.(t).~ ~N " 
- Une C, CG soumise aux restrictions; 
- seul A~ '# 
- ~(s) = , 
~ et t 6 ~- , ~(r) E % et 
est appel~e Gran=naire Context Free & Peignes (GCFP) 
- Une GCG (resp. GCFP) dans laquelle V r E ~, ~(r) cot un morphisme 
de SEG tel que tout peigne de la source ~(~(r) ) est utilis~ une fois et 
une seule dans le graphe, est appel~e GCG lln~aire (GCGL) (resp. GCFPL). 
Nous allons montrer que les GCFP sont une g~n~ralisation des grammaires 
CF. Soft une GCF = V', V T ,'R ~ S . On salt quWh tout GCF on 
peut faire ¢orrespondre une G~ s~taxlque ~quiu~en~ Une gram.mlre 
s~taxlque ~t une gra~alre dans laquelle Itens~ble ~des r~gles est 
la r~unlon disjointes des ens~bles et ', d~finis a~si= 
% { ( 
Ainsi soft ~e GC~ dans laquelle nous faisons, au nfveau de l'expression; 
la restriEtion 
(On remarque que y est plus pulssante que ~) 
I~ restriction yet le fait que la grammaire ~ soit lin~aire impliquent 
que V r E ~ , ~(r) est un prodult de juxtaposition (au sens monolde). 
Et d'apr~s or, pizisque l'alphabet E AT ~ n'est plus un alphabet gradu~, 
~t aini ~ tout r~gle ~ ~ ~N ~d~ '~') r~, ~ ----> ~ on ~af= corrospondre 
dlune mani~re unique une r~gle r E ~ (de f~) 
^ 
r : B ----> A (e,t r~ciproquement). 
- 10 - 
A toute r~gle r T E (de ) r T : B ----> @ E V T on fait correspondre 
d'une mani~re unique une r~gle t E ~ (de ~) t : B ----> telle queau 
niveau de I Iexpression c~'(t)= ~ (et r~ciproquement). 
Lem~le 
w 
Ainsi ~ toute GCF ~Ion peut faire correspondre une GCFPL_ ~ ~, soumlsesaux 
deux restrictions ~ et y, telle que 9'et ~ soient fortement ~quivalentes. 
Nous allons maintenant donner l'exemple dtune GCFP (de peu d'int~r6t 
linguistique puisqu'elle n'engendre qu'une phrase). 
Emmmple: 
Donn~es de Composition. 
- ~ = { S , Art , N , V , SN } 
i*o **} 
r o : S----> SN.V.S N , S N ----> Art.N 
= { to' t I, t 2, t 3 ~ 
t o : V----> , t I : N ----> , t 2 : N -----> , t 3 : Art --> 
Donn~es dte~ression 
~ " ~A { the, off, switches, boy, light } 
" ~A est d~fini par • 
q(s) = t, q(v) = 2, q(N) = ~, 
/ 1 
I ~o) = 
= 
~A(Art) = I. 
2 3 
F-q L 
i 
- 11- 
~A(rl) = 
1 2 
L I 
1 2 
I I 
- ~ est d~flni par: 
~(t e) = swltches-off 
~X(t I) = boy, ~(t 2) = lights, =%(t 3) = 
- le seul syntagme compos~ constrult avec '~A estz 
( S = s~ rt'N'V'Art'N ^ ; t = t3tltot3t 2. ) . 
et le seul syn~agme exprim~ est, ~(S){ ~i(t)} 
c'est-~-dire laphrase: the boy switches the light off. 
J 
the 
§ 4. UNE PROPRI~.TE ALGEBRIQUE DES C~F. 
Soit une GCG ~telle que l'alphabet terminal est r~duit 
un seul terme x qul a une insertionz AT = { x} 
On d~montre le th~or~me sulvant: 
qontient Th~or~me. Tout langage L sur un alphabet ~ = \[ x~ soit une progression 
@ 
arithm~tique sur x, soit une progression g~om~trlque de la forme: 
L = { :~ + uvkl u, v, ~, fixes ~ t~, a~ee u ot v ~ o ot k ~ ~} 
c'est ainsl que l'on d~montre que le langage L(1)~ 
n'est pas d u type GCG, alors que Friant montre que L(1) est engendr~ par 
une grammatre CS. 
C'est pourquoi on peut donner la classification suivantez 
CF c CFP c CS 
les inclusions sont toutes strictes. 
- 12 - / 

References

J. P. Benz~cri, Hodo Imago Nati (Inst.'Star. Univ. Parisp 1966) 

J. P. B~nz~crl, Linguistique Eath~matique, nlg~bre des constituants 
non connexes (Inst. Star. Univ. Paris, 1966). 

J. Friant, Th~se de 3 ° cycle~ Los langages CS (Inst. Star* Univ. Paris, 
t966). 

R. D. Guedj, Th~se de 3 ° cycle: Les grammaires de constituants g@n~raux 
(Inst. Star. Whir. Paris, 1966) 
