Multilinguisation d'un ~diteur de documents structur6s. 
Application/~ un dictionnaire trilingue 
Huy Kh~mh PHAN & Christian BOITET 
GETA, Institut IMAG 
(UJF & CNRS) 
BP 53X - 38041 Grenoble Cddex, France 
phan@imag.fr, boitet@imag.fr 
R~sum~ 
Pour "multilingualiser" (et non simplement 
"localiser") Gif, un 6diteur de documents structures, 
nous avons d6fini un langage de transcription, appel6 
langage E, analogue aux autres langages (S, Pet T) de 
Grif. 
E est utilis6 pour compl6ter la description 
structurale d'une classe de documents, 6crite en S, 
par une description "linguistique" concemant les 
syst~mes d'6cnture utilis6s clans les diff6rentes 
sous-structures des documents de la classe. 
Gr/tce ~ cette extension multilingue, on a pu 
construire une premi6re structure de dictionnmre 
trilingue chinois-fran~;ais-vietnamien, et l'utiliser 
sur un dictionnaire rEduit. 
Mots-el6s 
ModUle de document, 6dition de documents 
structur6s, syst~mes d'dcriture, multilinguisme, 
transcriptions. 
Introduction 
En informatique, les probl6mes du multilinguisme 
se posent actuellement avec acuit6. Tant les mat6riels 
que les logiciels sont h~t6rog~nes et incomplets. 
Certes, il existe un "documenteur" multilingue, le 
Star de Xerox \[1\]. Mais il s'agit d'une solution 
ferm6e, sur mat6riel spEcifique. 
Quant aux outils dits "multilingues", comme le 
texteur WinText \[16\], ou le SGBD 4D, tous deux sur 
Macintosh, ou encore les diverses extensions du 
formateur TEX \[5, 6, 7, 15\], il s'agit en fait de 
"localisations", qui h6ritent leurs possibilitEs et leurs 
limites du syst~me d'exploitation sous-jacent. 
I1 est encore impossible, avec ces outils, d'6crire et 
d'utiliser en m~me temps deux (ou plus de deux) 
syst6mes d'6criture non "classiques" (chinois, 
japonais, arabe, par exemple), en sus des syst~mes 
classiques, traitables par simple ajout de polices 
ad6quates. 
Pour 6tudier concr~tement et utilement les 
probl~mes de multilinguisation de logiciels, nous 
avons travaill6 sur un "documenteur" (syst6me de 
)arOduction de documents) de haut niveau et tr6s 
rgement param6trable, Grif, d6velopp6 par 
V. Quint et I. Vatton \[10, 11, 12\]. 
Nous sommes ainsi arriv6s ~t Grif-m, une version 
r~ellement multilingue \[9\] de Grif, et l'avons utilis6 
pour construire un prototype de dictionnaire trilingue 
chinois-fran~ais-viemamien. 
Ce type de technique pourrait ~tre appliqu6 A des 
"bases lexicales multilingues" plus complexes, 
comme celles visEes par le prujet ESPRIT Multilex 
\[8\]. 
I. Multilinguisation de Grif 
1.1. Grif et ses langages S, P, T. Introduction de E 
Dans Grif, on d6finit un mod61e de document pour 
d6crire une classe de documents ~t manipuler. I1 s'agit 
de documents structures. On spEcifie s6par6ment la 
structure logique et la presentation physique. 
La structure logique est d6finie en Set refl~te 
l'organisation arborescente des composants du 
document, tels que sections, sous-sections, 
paragraphes, tableaux, formules et sous-formules 
mathdmatiques, etc. 
La pr6sentation physique est d6finie en P et ddcrit 
l'image concr6te de ces composants dans un certain 
contexte de restitution (6cran, imprimante). 
On pent d6finir en Grif tout mod61e de document 
d6finissable en SGML, avec de plus la possibilirE de 
crEer diverses vues (une vue est un filtre donnant une 
fat, on de voir certaines parties du document), et 
d'interagir avec le document, en wysiwyg, h travers 
toute vue. 
Voici la description en S de la structure de la classe 
"Article". Un article contient, dans l'ordre 
d'apparition, un titre, des auteurs (au moins 1), des 
adresses, un r6sum6, une suite de sections (au moins 
2), etc. 
STRUCTURE Article = 
BEGIN 
Titre = TEXT; 
Auteurs = LIST \[i..*\] OF 
(Auteur = TEXT); 
Adresses = LIST OF (Adresse=TEXT); 
R~sum~ = LIST OF (Paragraphe); 
Suite Sections = LIST \[2..*\] OF 
(SeCtion); 
END; 
Section = 
Titre Section = TEXT; 
Suite~Paragr; 
Suite Sous Sections = LIST \[2..*\] OF 
SoWs Section 
END; 
Figure 1. Un schdma de structure en langage S. 
Enfin, lc langage T permet d'exprimer la 
traduction de la representation "pivot" d'un 
document Grif en une repr6sentation aans un autre 
formalisme, tel que SGML, TE X, LATEX, Scribe, 
ouTroff. 
L'une des applications int~ressantes de Grif est la 
construction de classes de documents bilingues 
(franqais-anglais, par exemple), voire multilingue. 
AcrEs DE COLING-92. NANTES, 23-28 AOt~f 1992 9 6 6 PROC. OV COLING-92. NAN'rEs, AUG. 23-28, 1992 
Dans sa version originale, Grif travaille avec 
l'alphabet latin de la norme ISO (augmentd de 
certains caraetbres accentuds usuels) pour le texte, et 
avec l'alphabet grec pour \]es fbrmules 
mathdmatiques. 
Pour multilingualiser Grif, d'une faqon cohdrente 
avec sa conceptton globale, fondde sur la gdndrieitd, 
nous avons drfini un langage de "transcription 
d'entrre", appeld langage E \[9\]. E est homog6ne avec 
les autres langages de Grif. C'est done un langage 
descriptif et non imprratif. 
Gr,qce ~t E, on peut ddcrire en Grif-m de nombreuses 
caractdristiques de chaque systrme d'dcriture traitd, 
et rrsoudre ainsi une bonnepartie des problrmes posds 
par le multilinguisme (codage, saisle, restitution et 
dialogue). 
Cependant, les r~gles de typographie fine (ligatures, 
forme ddpendant du contexte, etc.) ne peuvent pas ~tre 
ddcrites en E (il faudrait l'6tendre notablement). 
1.2. Ddfinitionetimpl~mentationdulangageE 
Pour ddfinir la syntaxe de E, nous avons utilis~5 la 
m~me mdta-grammaire que celle utilisde pour ddfinir 
les langages S, P et T. Au occur de Grif, on trouve en 
effet un noyau de gdndrateur de compilatem~. 
En E, on ddfinit des parambtres d'ddition et des 
rrgles de transcription. 
Les parambtres concement les aspects d'entrde- 
sortie. Par exemple, nous avons des paramrtres 
d'entrre, comme jeux de caractbres et mdthodes de 
saisie, et des param~tres de sortie conc.emant les 
polices de caractbres disponibles pour la restitution et 
pour le dialogue. 
Les r~gles ddfinissent les repr,Ssentations utilisres 
pour la sa~sie, le codage et la restitution, ainsi que leur 
correspondance. Une entrre est d6finie en prenant en 
compte l'utilisation d'un clavier QWERTY 
standard. C'est une chaMe de caract~res qui ddnote la 
suite de frappes ~ effectuer. 
Dans une rbgle, une eutrre pout donner ace, s ~ une 
ou plusieurs transcriptions, chacune correspondant 
un caractbre. Un caractbre peut avoir dgalement un 
ou plusieurs codes d'affichage (numdros d'image). 
Nous avons proposd actuellement trois types de rrgle 
de transcription, normal, homophone, et 
morphologique, correspondant aux relations 
(1-> 1-> 1), (l -> N-> N) et (1-> 1 ->N). 
Par exemple, A -> 'A' -> 65; est une r~gle trrs 
simple, de type (1 -> l -> 1), qui indique que l'entrre 
A correspond au code interne drnot6 par 'A' (#65) et 
au caract~re n ° 65 darts les polices disponibles. 
La r~gle ci-dessous pern~et de saisir l'un des quatre 
caract~res chinois homophones prononc6 A au 
premier ton en entrant al au clavier, puis en 
srlectionnant parmi les possibilitrs offertes dans un 
menu. 
'{ commentaire entre accolades ) 
al -> ('AI-7/FU4-2' -> 1602,{~\]} 
l 'AI-6/KOU3-3' -> 6325, { 0\]" } 
Figure 2. Une rdgle de type (1 -> N -> N). 
A. chaque caract~re, nous faisons eorrespondre son 
code PS minimal (par rapport au dictionnaire CIHAI 
\[4\], de 15000 caraceres), prrsent6 plus loin, et son 
code GB (norme GB 2312-80 \[14\] pour les caract~res 
chinois simplifids utilisds en Chine Populaire). 
11 y a aussi des rSgles de type (1 -> 1 -> N), comme la 
r~gle darts la figure 3 pour les caract~res grecs, oh 
l'entr6e s correspond au code interne ddnot6 par %' 
(une transcription "locale" prrsent6e plus loin) et aux 
caractrres ~ et ~ (variante morphologique de o 
quand celui-ci se trouve en fin d'un mot en grec). 
P 
1~-> '~' -> (iz5 I~ I, 8G {g ~l; \] 
Figure 3. Une rdgle de type (1- -> 1 -> N). 
' La syntaxe des r~gles permet donc de drfinir un ou 
plusieurs codages (reprrsentation interne) des 
caract~res d'un syst~me dfcriture donnr. Ainsi, selon 
l'application visre, on peut utiliser des normes 
ex~stantes (ASCII "nationaux" ou codages sur deux 
octets comme JIS ou GB 2312-80), en taille fixe (2, 3, 
4 octets) ou variable, ou encore des transcriptions ~ la 
TEl (,~ un caract,~re correspond une clm'~ne ASCII 
"lisible"). 
Le codage drcrit est aussi utilis6 pour 6crire les 
intitulrs de dialogue. En effet, il laut que l'utilisateur 
puisse dialoguer avec le systrme darts la langue de son 
choix, tout en manipulant un document. 
La compilation d'un schrma 6crit en E toumit des 
tables de transcription contenant les caractrristiques 
drcrites dans le schrma. Ces tables, sous forme 
interne, servent ~ guider le proeessus de traitement 
d'un texte. 
Par exemple, pour traiter les caract~res avec 
signes diacritiques vietnamiens, nous produisons une 
table de v6rification qui donne les possibilitrs de 
combinaison de deux signes diacritiques, et une table 
de consultation qui donne les informations de codage et 
d'affichage des caract~res pour le syst~mes d'rcriture 
vietnamien. 
Notre impMmentation du langage E permet aussi la 
gestion des ressources de restitution. On peut 
introduire des polices de caract~res de styles divers, 
comme soulignr, relief, etc., puis les utiliser clans un 
sch6ma 6crit en E. Pour l'impression, Grif pmduit 
directement un I\]chier PostScript. On peut aussi 
utiliser q' pour traduire vers un autre format ('rEX, 
LATEX, SGML...). 
Au total, il a suffi de modifier environ 15% du code 
de Grif pour obtenir Grif-m. 
1.3. Rdalisationd'uneversionmultilinguedeGrif 
Une lois E disponible, nous l'avons utilis6 pour 
crder une version multilingue de Grif, permettant de 
traiter des documents contenant, outre des fragments 
"classiques", du vietnamien et du chinois. 
Cette limitation est uniquement due au d61ai dont 
nous disposions. Toutefois, notre rralisation rrsoud 
deux p~obl~mes assez frrqucnts darts les syst~mes 
d'fcriture autres que les syst~mes fondrs sur 
l'alphabet latin, ~ savoir la multiplicit6 des 
diacritiques (viemamien, thaL.) et la taille des grands 
jeux de caract~res (chinois, japonais). 
Par contre, nous n'avorts pas encore trait6 les 
dprohlrmes de sens d'rcdture, d'analyse de contexte, 
e ligature..., posrs par quelques syst~mes d'rcriture, 
comnle l'arabe. 
AcrEs DE COLING-92, NANTES, 23-28 AOU-f 1992 9 6 7 PROC. OF COL1NG-92. NANaES, AUG. 23-28, 1992 
Nous avons commencM par 6crire en E les sch6mas 
de transcription pour le viemamien et pour le chinois. 
Pour le viemamien, il s'agissait de d6crire les 
caract~res portant des signes diacritiques (comme 
pour les caract~3res accentu6s latins de la norme ISO), 
aisin que la m6thode de saisie. 
Darts la d6finidon suivante (en E), on indique que la 
saisie se fera par composition ~ gauche (insertion du ou 
des diacritiques avant la lettre). 
PARAMS IN 
Set = Romain; 
Language = vietnamien; 
Entry = LEFTCOMPO; 
{ saisie par composition ~ gauche } 
Letters = (A, D, E, I, O, U, Y, a, d, 
e, i, o, u, y); 
Signs = ( 
CI circonflexe ^ 
(pour A a E e O o)}, 
BR br~ve (pour A a) }, 
VQ crochet ' (pour O o U u 
VQ grave 
QU question , 
TI tilde ~ 
AC aigu ' 
PE point 
EN barre (pour D d) 
MaxSigns = 2; 
{ deux signes maximum par lettre 
}r 
1, 
}, 
1, }, 
1, }); 
Figure 4. Paramdtres d' entrde pour le vietnamien. 
Le codage des caract~res diacrit6s vietnamiens 
(134 au total) utilise une transcription, fond6e sur la 
norme ISO-025 des caract~res franqais, d6velo.pp6e et 
utilis6e au GETA \[2\] pour la TAO d'autre langues 
utilisant l'alphabet romain. 
Dans cette transcription, on utilise la 
combinaison du signe '!' et d'un nombre pour 
representer un diacmique ('!1' pour l'accent aigu ", 
'!2' pour l'accent grave ", '!3' pour l'accent 
circonflexe ~, etc.). Par exemple, ~l est repr6sent6 par 
'a! 1 ', et ~ par 'e!3!2'. 
La r~gle suivante donne le codage du caract~re 
avec la correspondance entr6e-sortie (entree par une 
suite de frappes et num6ro d'image dans la police 
disponible): 
I CI GR e -> 'e!3!2' -> 165; 
Pour les caract~res chinois, nous utilisons le code 
PS (phon6tico-structural) de Ch. Boitet et F. Tchdou 
\[31. 
Ce code repr6sente un caract~re chinois par une 
suite (minimale) de triplets (pinyin, ton, nombre de 
traits), le premier concernant le caract~re entier, le 
second sa c16 "sdmantique" (radical), et les suivants 
les autres radicaux contenus dans le caraet~re, par ordre d'6criture. 
U utilise un ensemble r~duit de caract~res contenu 
dans l'alphabet de PL/I. 
Par exemple, HAO3-6/NU:3-3 repr6seme le 
caract~re chinois ~ Cbon"). Ce caract~re se 
prononce HAO au troisi~me ton (rentrant ~) et 
comporte 6 traits. Sa c16 sdmantique (7(/-, "femme") 
se prononce NU: au troisi~me ton eta 3 iraits. 
L'6criture compl6te d'un sch6ma de transcription 
du chinois demande un temps apr6ciable. Pour 
acc616rer le travail, nous avons utilis~ les fichiers de 
donn6es de saisiepinyin et le8 polices de caract~res 
chinois simplifi6s disponibles au laboratoire GEDIS de 
l'Universit6 de Lille 1. 
II. Application ~t un dietionnaire trilingue 
ehinois-franqais-vietnamien 
H.1. Descriptiondudictionnaire 
Remarquons d'abord qu'il s'agit d'6dition 
stmctur6e, et en aucune faqon de gestion de ba~ de 
donn6es. 
D'autre part, la structure que nous d6finissons pour 
cette classe de documents (dictionnaires trilingue 
chinois--frant;ai s-vietnamien) est volontairement 
tr6s simple. La rendre plus complexe ne poserait 
aucun probl6me. 
Un dictionnaire est une liste d'articles rang6s dans 
l'ordre de transcription pinyin \[5\] des caract~ms 
chinois. 
Un article contient : 
- son num6ro. 
- l'entr6e ou c16 (un terme en caract~re chinois). 
-la prononciation (transcription pinyin suivie 
d'un chiffre de 1 tt 4 d6signant le ton, continu -, 
montant ", rentrant ~, descendant "). L'absence 
de ton mprfsente le ton faible. Par exemple, 5k, 
("grand") se prononce ddet est d6not6 DA4. 
- la cat6gofie grammaticale (nora, adj., adv., ver.). 
- le type d'utilisation (normale (nor.), famili6re 
(tam.), argotique (arg.), etc.). 
- le ou les ~quivalents fran~ais. 
- le ou les 6quivalents vietnamien8. 
La vue principale, Dict trois Langues, pr6sente 
le contenu complet du dicd-onnal-re. 
On d6finit sa pr6sentation en demandant de mettre 
en t~te le titre en trois langues, suivi de la liste des 
auteurs et d'un mode d'emploi en fran~ais, form6 
d'une suite de paragraphes. 
Les entrdes sont rang6es en lignes et leurs 
rubriques en colonnes, dans l'ordre d'apparition. 
Les num6ros d'entr~e ~nt pr6sent6s en caract~re 
,eraS, les transcriptions phon6tiques entre crochets, s abr6viations de catdgorie et d'utilisation en 
it.aliques, et chacun des 6quivalents franqais et 
vlemamtens est affich6 sur un paragraphe 
inddpendant. 
On a ddfini trois autres vues. La vue Vue Chinoise 
est en fait un dictionnaire monolingue-montrant 
uniquement les caract~res chinots (graphie, 
transcription, cat6gorie et utilisation). 
Les rues Vue Fran#aise et Vue Viemamienne 
sont les dictionn~ires bilingues chin6is-franqais et 
chinois--vietnamien extraits du dictionnaire 
trilingue. 
11.2. Ddfinition en S et P du dictionnaire trilingue 
La d~finition suivante de la structure du 
dictionnaire, 6crite en S, impose qu'il contienne au 
moins deux ent~es (LISTE \[2..*\] OF (Entr6e= 
• . .) . 
ACRES DE COLING-92, NANTES, 23-28 no(Jr 1992 9 6 8 PROC. OF COLING-92, NANTES, AUG. 23-28, 1992 
STRUCTURE DicTriLing :- 
BEGIN 
Titre = 
BEGIN 
TitreChinois - TexteChinois; 
TitreFrangais = TexteFrangais; 
TitreVietnamien = TexteVJetnamien 
END 
Auteurs = LIST OF 
(Auteur = TexteFrangais); 
ModeEmploi = LIST OF 
(ParagrModeEmploi = TexteFranGais) 
Corps Dict = LIST \[2..*\] OF (Entr@e 
BEGIN 
Graphie = TexteChinois; 
Phon@tique = TexteFrangais; 
Cat~gorie = TexteFrangais; 
Utilisation = TexteFrangais; 
Equival franGais = LIST OF 
(Equ franGais = TexteFrangais); 
Equival vietnamien = LIST OF 
(Equ_~rancais = TexteVietnamien); 
END); 
END; 
Figure 5. Structure en S du dictionnaire trilingue 
Aux types Textechinois, Texte frangais et 
Texte_viemamien sont associ6es les m6thodes de 
saisie ad6quates : un 616ment chinois scra saisi 
travers l'interface de saisie du chinois. 
Le sch6ma de pr6sentation en langage P d6flnit la 
faqon de restituer sur l'6cran ou sur papier le contenu 
du dictionnaire en toute vue pr6vue. On y d6crit la 
pr6sentation physique de chaque 6Mment d6fini dans 
le sch6ma de structure. 
Par exemple, pour afficher un caract~re ehinois sur 
un rectangle de largeur 1,2 cm et de hauteur celle de 
la police de caract~res ehinois disponible, on 6erit en 
P: 
Graphie : cm; BEGIN 
Width : i. 2 cm; 
VertPos Top = Enclosing. Top; 
HorizPos Left = Enclosing. Left+l 
Figure 6. Structure en P d' un 616ment du 
dictionnaire trilingue 
11.3. Exemple 
Voici une partie du dictionnaire trilingue chinois- 
franqais-viemamien 6dit6 avec cette version de 
Grif-m (Sun3 / Unix / X-Window VIIR3). 
~ODE \[r E~t~l 
i \[i) i ii il 
t; \[ I ) ~ ': 
r~i~ F~n-Pa~-Vi~ 
~-~-~ 
Dlcllollil,alre Chlnols - Fr~ - Vlclnam~n 
PHAN Hwj gh~/~ 
¢hlml& Li atruetun 6' ~ ~atr~r ¢~t hi ItLvm~t¢ : 
{ae~l,et~; 
In~l~nlia/~ ; a~lletneat, ~ n'a~ ~ e~ nttr~at~ I~l ~ (~ da\[t I~ 1~ldt ~ bl 
friar ~ t.t I~t tt~ agoe0cdor~, ~ ~a~I~, ed ~ ~ d¢l II~ ¢nu~ knl ¢q~ ~ ~bl 
0bJrlata ~lrl~hlt, trn~i~lptlom v~hl0He a utllllld~t Enllm 1~ ~ ~.j~g'~ll¢ ¢t 
~" 
Figure 7. Quatre vues diff~rentes d' un dictionnaire trilingue chinois-frangais-vietnamien 
(Dict trois Langues, Vue Chinoise, Vue_Fran~aise et Vue_Viemamienne). 
AcrEs DE COLING-92, NANTES, 23-28 Ao(rr 1992 9 6 9 Pkoc. oF COL1NG-92, NANTES. AUG. 23-28, 1992 
A partir du "squelette", ddcrit en P par un schdma 
de prdsentation, et mis en 6vidence par une 
sous-fen~tre contenant des rectangles grisds, 
l'utilisateur remplit le contenu du dictionnaire dans 
les langues disponibles. Pour les caractdres chinois, il 
dispose d'une sous-fen~tre de saisie impldmentant la me~thode de saisie pinyin ddcrite darts le schdma 6crit 
en E. 
IlL Perspectives 
Ce travail sur la multilinguisation de Grif permet 
de proposer des m~thodes r~utilisables dans diverses 
applications, non seulement en PAO (Publication 
Assistde par Ordinateur), en EAO (Enseignement 
Assist6 par Ordinateur), mais encore en TALN 
(Traitement Automatique des Langues Naturelles) : 
lexicegraphie, indexation automatique, recherche 
documentaire, etc. 
Par exemple, il devrait dtre rclativement aisd de 
ddfinir une classe de documents "bitextes", pour 
obtenir h partir de Grif un dditeur bilingue, avec 
synchronisation automatique des paragraphes. De 
meme, on pourrait construire une interface 
conviviale avec des bases lexicales multilingues. 
ll reste h compldter les aspects, principalement lids 
aux probl~mes de restitution (c~sure, typographie 
fine, sens d'6crimre...), pour pouvoir traiter d'autres 
syst~mes d'6criture, commc ceux de l'arahe, de 
l'h6bmu, du thai', etc. 
Ce qui concem¢ le sens d'dcriture est du domaine de 
la pr6sentafion et ne semple pas offrir de difficult6 
particuliSre. 
Par contre, il faudrait un niveau suppl6mentaire 
pour exprimer les r~gles contextuelles rdgissant le 
choix entre diffdrentes formes pour la m~me lettre 
(arabe). 
I1 nous semble 6galement important de travailler 
dans le cadre de TEl(Text Encoding Initiative) \[13\], 
en particulier pour ddvelopper des transcriptions utilisables en TEl (off par exemple le signe "!" joue un 
r61e special), ainsi que les transcripteurs associds. 
Conclusion 
La ddfinition du langage E a permis de compldter la 
notion de moddle de document de Grif, dans lequel les 
auteurs de Grif avaient ddj~t remarquablement bien 
trait6 les aspects structuraux et interactifs, au niveau 
des systdmes d'dcriture. L'approche suivie semble nouveUe, et efficace, puisque nous avons rdalis6 une 
version prototype rdellement multilingue. 
Avec cette premidre version, nous avons construit 
une structure de dictionnaire trilingue 
chinois-fran~ais-viemamien assez simple, mais trds 
illustrative, puisqu'on peut manipuler un 
dictionnaire /t travers diverses vues, monolingues, 
bilingues et trilingues, en traitant naturellement 
chaque champ dans le syst~me d'dcriture appropri& 
Remerciements 
V. Quint et I. vatton nous ont pennis d'utiliser 
leur version de recherche de Grif, et n'ont pas mdnag6 
leur temps pour en expliquer les ddtails. A. Cousquer et son ~lm~pe ont mis ~t notre disposition toutes les 
resources informatiques ndcessaires ~ la restitution 
du chinois. Enfin, F. Tchdou nous a grandement aidds 
pour ce qui conceme la transcription PS des 
caract~:res chinois. 
R~f~rences 
\[1\] J.D. BECKER (1984) Le traitement de Texte 
Multilingue Pour la Science, sept. 1984, 66-76. 
\[2\] C. BO1TET, D. BACHUT, R. GERBER (1986) 
ARIANE portable : Dossier d'analyse 
Grands Caraetdres.Version 2.0, PN-TAO & 
GETA, Grenoble, mai 1986, 46 p. 
\[3\] C. BOITET, F. X. TCHI~OU (1990) On 
a phonetic and structural encoding of Chinese characters in Chinese texts. 
Proc. ROCLING 
III, Taipeh, Aug. 1990, 71-80. 
\[4\] CIHAI ~ ~ (1983)LargeDictionaryof 
Chinese Characters and Words 
4th edition, Ci Shu, Shanghai, 1983, 5540 p. 
\[5\] A. COUSQUER (1990)Enchinoisdansle 
TEXte. Cahiers GUTenberg, n°6, juillet 1990, 
15-24. 
\[6\] M.J. FERGUSON (1986) Multilingual TEX. X for Documentation.Second 
European 
Conference. Strasbourg, June 1986, 19-21. 
\[7\] Y. HARALAMBOUS (1989) TEXandlatin 
alphabetlanguages.TUGboat, 10/3, 1989, 342-345. 
\[8\] G. HEYER, K. WALDHOR & 
H. KHATCHADOURIAN (1991)Motivations, 
Goals & Milestones of ESPRIT 11 Project 
MULTILEX. Conferences & Exhibition on 
Language Industry, EC2, Volume 1, 
Session 10 on R & D, Versailles, Jan. 16-17, 
1991. 
\[9\] H.K. PHAN (1991) Contribution d 
l' informatique multilingue. Extension d' un dditeur de documents structurds. 
Thdse de 
Doctorat, Universit6 des sciences et techniques 
de Lille Flandres Artois, mai 1991, 231 p. 
\[10\] V. QUINT, I. VATTON (1986) Grif: An 
Interactive System for Structured 
DocumentManipulation. Text Processing and 
Document Manipulation, Prec. of the 
International Conference, J. C. van Vliet ed., 
Cambridge University Press, 1986, 200-213. 
\[11\] V. QUINT, I. VATTON, H. BEDOR (1986) 
Le systdme Grif. T.S.I., 5/4, 1986, 337-341. 
\[12\] V. QUINT (1987) Uneapprochederddition 
strgcturde des documents. Th~se de Doctorat 
d'Etat 6s-Science Mathdmatiques, Universit6 
Joseph Fourier (Grenoble 1), mai 1987, 283 p. 
\[13\] C.M. SPERBERG-MCQUEEN & L. 
BURNARD (1990) ACH-ACL-ALLC 
Guidelines for the Encoding and Interchange of 
Machine-Readable Texts. TEl P1, Draft 
Version 1.0, Chicago and Oxford, July 1990, 
279 p. 
\[14\] The People's Republic of China (1981) Code of 
Chinese graphic Character set for lnformation Interchange. Primary set GB 2312-80. 
Fuxing-menwai Sanlihe, Beijing, China, 1981, 175 p. 
\[15\] B.E. VOGEL (1989)PrintingVietnamese 
characters by adding diacritical marks via TE X. 
TUGboat, 10/2, 1989, 217-223. 
\[16\] WINSOFT (1988) WinText, le traitement 
de textes multilingues pour Macintosh.Version 
2.0, WinSoft, 1988, 392 p. 
Ac'rr~ DE COLING-92. NANTES, 23-28 Aot)r 1992 9 7 0 Pgoc. OF COLING-92, NANTES, AUG. 23-28. 1992 
partir du "squelette", d6crit en P par un sch6ma 
de prdsentation, et mis en 6vidence par une 
sous-fen~tre contenant des rectangles gris~s, 
l'utilisateur remplit le contenu du dictionnaire dans 
les langues disponibles. Pour les caract~res chinois, il 
dispose d'une sous-fen~tre de saisie impldmentant la 
m6thode de saisie pinyin d6crite dans le schdma 6crit 
en E. 
III. Perspectives 
Ce travail sur la multilinguisation de Grif permet 
de proposer des mdthodes r6utilisables dans diverses 
applications, non seulement en PAO (Publication 
Assist6e par Ordinateur), en EAO (Enseignement 
Assist6 par Ordinateur), mais encore en TALN 
(Traitement Automatique des Langues Naturelles) : 
lexicographie, indexation automatique, recherche 
doctunentaire, etc. 
Par exemple, il devrait ~tre relativement ais6 de 
d6finir une classe de documents "bitextes", pour 
obtenir /l partir de Grif un ~diteur bilingue, avec 
synchronisation automatique des paragraphes. De 
m~me, on pourrait construire une interface 
conviviale avec des bases lexicales multilingues. 
I1 reste ~t compl6ter les aspects, principalement li6s 
aux probl~mes de restitution (c6surc, typographic 
fine, sens d'6criture...), pour pouvoir traiter d'autres 
syst~mes d'6criture, comme ceux de l'arabe, de 
l'h6breu, du thai', etc. 
Ce qui conceme le sens d'~criture est du domaine de 
la pr6sentation et ne semple pas offrir de difficult6 
particuli~re. 
Par contre, il faudrait un niveau suppl6mentaire 
pour exprimer les r~gles contextueUes r6gissant le 
choix entre diff6rentes formes pour la m~me lettre 
(arabe). 
I1 nous semble 6galement important de travailler 
dans le cadre de TEl (Text Encoding Initiative) \[ 13\], 
en particulier pour d6velopper des transcriptions 
utilisables en TEl (ot~ par exemple le signe "!" joue un 
rSle special), ainsi que les transcripteurs associ6s. 
Conclusion 
La d6finition du langage E a permisde compl6ter la 
notion de module de document de Grif, dans lequel les 
auteurs de Grif avaient d6j~ remarquablement bien 
trait6 les aspects structuraux et interactifs, au niveau 
des syst~mes d'6criture. L'approche suivie semble 
nouvelle, et efficace, puisque nous avons r6alis6 une 
version prototype r~ellement multilingue. 
Avec cette premiere version, nous avons construit une structure de dictionnaire trilingue 
chinois-franqais-vietnamien assez simple, mais tr~s 
illustrative, puisqu'on peut manipuler un 
dictionnaire ~ travers diverses vues, monolingues, 
bilingues et trilingues, en traitant naturellement 
chaque champ clans le syst~me d'6criture appropri6. 
Remcrciements 
V. Quint et I. Vatton nous ont permis d'utiliser 
leur version de recherche de Grif, et n'ont pas m6nag6 
leur temps pour expliquer les d6tails. A. Cousquer et 
son &luipe ont mm ~ notre disposition routes les 
resources informatiques n6cessaires ~ la restitution 
du chinois. Enfin, F. Tch6ou nous a grandement aid6s 
pour ce qui concerne la transcription PS des 
caract6res chinois. 
R~f~rences 
\[1 \] J.D. BECKER (1984) Le traitement de Texte 
Multilingue Pour la Science, sept. 1984, 66-76. 
\[2\] C. BOITET, D. BACHUT, R. GERBER (1986) 
ARIANE portable : Dossier d'analyse 
Grands Caractdres.Version 2.0, PN-TAO & 
GETA, Grenoble, mai 1986, 46 p. 
\[3\] C. BOITET, F. X. TCHI~OU (1990) On 
a phonetic and structural encoding of Chinese 
ctlaracters in Chinese texts. Proc. ROCLING 
III, Taipeh, Aug. 199(I, 71-80. 
\[41 CIHAI ~t~ ~jE (1983) Large Dictionary of 
Chinese Characters and Words 
4th edition, Ci Shu, Shanghai, 1983, 5540 p. 
\[5\] A. COUSQUER (1990) En chinois dans le 
TEXte. Cahiers GUTenberg, n°6, juillet 1990, 
15-24. 
\[6\] M.J. FERGUSON (1986) Multilingual TEX. X for Documentation.Second 
European 
Conference. Stvasbourg, June 1986, 19-21. 
\[71 Y. HARALAMBOUS (1989) TEXandlatin 
alphabetlanguages.TUGboat, 1\[)/3, 1989, 
342-345. 
\[8\] G. HEYER, K. WALDHOR & H. 
KHATCHADOURIAN (1991) Motivations, 
Goals & Mil~tones of ESPRIT II Project 
MULTILEX. Conferences & Exhibition on 
Language Industry, EC2, Volume 1, 
Session 10 onR & D, Versailles, Jan. 16-17, 
1991. 
\[9\] H.K. PHAN (1991) Contribution d 
l' informatique multilingue. Extension d' un ~diteur de documents structures. 
Th~se de 
Doctorat, Universit6 des ~iences et techniques de Lille Flandres Artois, mai 1991, 231 p. 
\[10\] V. QUINT, 1. VAq~I'ON (1986)Grif: An 
Interactive System for Structured 
DocumentManipulation. Text Processing and 
Document Manipulation, Proc. of the 
International Conference, J. C. van Vliet ed., 
Cambridge University Press, 1986, 200-213. 
\[11\] V. QUINT, I. VATTON, H. BEDOR (1986) 
Le systdme Grif. T.S.I., 5/4, 1986, 337-341. 
\[12\] V. QUINT (1987) Uneapprocheder~dition 
str~ctur#e des documents. Th~se de Doctorat 
d'Etat ~s-Science Mathdmatiques, Universit6 
Joseph Fourier (Grenoble 1), mai 1987, 283 p. 
\[13\] C.M. SPERBERG-MCQUEEN & L. 
BURNARD (1990) ACH-ACI~ALLC 
Guidelines for the Encoding and Interchange of 
Machine-Readable Texts. TEl PI, Draft Version 1.0, Chicago and Oxford, July 1990, 
279 p. 
\[ 14\] The People's Republic of China (19811 Code of 
Chinese graphic Character set for Information Interchange. Primary set GB 2312-80. 
Fuxing-menwai Sanlihe, Beijing, China, 1981, 
175 p. 
\[15\] B.E. VOGEL (1989) PrintingVietnamese 
characters by adding diacritical marks via TE X. 
TUGboat, 10/2, 1989, 217-223. 
\[1611 WINSOFT (1988) WinText, le traitement 
de textes multilingues pour Macintosh.Version 
2.0, WinSoft, 1988, 392 p. 
ACRES DE COLING-92, NANIE$, 23-28 Ao(rr 1992 9 7 1 I ROC. OF COLING-92, NANTES, AUO. 23-28, 1992 
