COLING 82, J. Horeck~ (ed.) 
North-Holland Publishing Company 
© Academia, 1982 
ZUM WIEDERAUFFTNDEN VON INFORMATIONEN 
IN AUTOMATISCHEN WORTERBOCHERN 
Gunter Neubert 
Sektion Angewandte Sprachwissenschaft 
Technische Univerait~t Dresden 
Dresden 
DDR 
Aus automatlschen WOrterb0chern kann oft nlcht so 
viel Information zur0ckgewonnen werden wie aus her- 
kSmmllchen gedruckten WSrterb0chern. Dae Ist u. a. 
auf Wortbildungssynonymle zur0ckzuf0hren, die mln- 
destens folgende Ursachen hat: unterschiedliche le- 
xlkallsch-morphematische Elemente, unterschledllche 
Konstruktion und unterschledliche Hotivatlon yon 
Wortbildungsprodukten. Es erscheint dienlich, Wege 
zur intellektuellen und programmgesteuerten Synthe- 
se synonymer AbfragewSrter zu suchen. 
EINFOHRU NG 
Unter einem "automatlschen WOrterbuch" wollen wlr einen technisch 
beliebl 9 gearteten Spelcher lexikalischer (speziell fachlexikall- 
scher/terminologlscher) Informationen verstehen, den ein 0bersetzer 
auf mittelbare Welse, d. h. unter Zwlschenschaltung elnes Suchpro- 
gramme, befragt, um Kenntnlsae 0ber die for die 0bersetzung zu w~h- 
lenden Aquivalente lexlkalischer Einheiten (oder dessenw was er da- 
for h~it) in der Zielsprache zu erlangen. Alia anderen mSgllchen 
Verwendungszwecke einea derartlgen Speichers, wie maschinelles 0ber- 
aetzen, Erlernen yon Sprachen, Gewinnen systematlscher Terminologle- 
0bersichten, A~fbau von Informatlonarecherchesprachen u. a. m., sei- 
en hier unber0cksichtigt. 
Automatlsche WSrterb0cher slnd heute wohl durchweg als Spelcher 
elektronischer Datenverarbeitungsanlegen ausgef0hrtr ale werden auch 
"Terminologledatelen" oder "termlnologische Datenbanken" genannt. 
Zu ihrar Befragung atehen Programmpakete unterschiedllchen lingul- 
atischen und reohentechniachen Komforts bereit. Oer 0bersetzer fragt 
entweder im Oialogverkehr 0bar Schrelbmaschlnentastatur und Bild- 
echlrm oder im Stapelbetrleb mit zeltlich verzSgerter Listenauagabe. 
SUCHPROBLEME 
Oer einfachate Suchalgorlthmus beruht auf dem zelchentreuen Ver- 
glelch des Abfragewortes I mlt den WSrtern I (derselben Sprache) im 
Spelcher. Es leuchtet eln, da~ eln sol,her Suchalgorithmus eine nur 
gerlnge effektlve Antwortquote 2 qe bieten kann, werden doch selbst 
bel Vergleichapaaren wle verbaler/substantivlerter Infinitiv ('sand- 
strahlen'/'Sandstrahlen') oder Zuaammen-/Getrenntachreibung ('slide- 
way'/'slide way') keine Antworten geliefert. Die Unterdr0okung yon 
Gro~-/Kleinschreibung, Zusammen-/Oetrenntschreibung und bestlmmZer 
Sonderzelchen wle des Bindestrichs ('Zwei-Richtungs-Verkehr'/'Zwei- 
richtungsverkehr') erhSht qe nur unweeentlich, denn Vergleichspaare 
259 
260 G. NEUBERT 
wie 'Gasaufkohlen'/'Gasaufkohlung', 'Pfetlv~rzehnung'/'pfetlver- 
zahnt' u. Q. bletben welter unerschlteBbar. 
Zur Beseitlgung dleses Nachteils des automatischen gegen0ber dem ge- 
druckten WBrterbuch wurden verschledene Verfahren entwlckelt, wle 
die der l~ngstmOglichen 0berelnstlmmung oder des Abschnsldens yon 
Endzeichen(ketten) nach Vergleich mlt elner Lists zul@selger bzw. 
potentieller Endzeichen(ketten). FOr lhr befriedlgendes Funktlonie- 
ten sind aber stets emplrlsche Zusatzregeln und/oder -informetionen 
erforderllch. Andere Abfregeve~fahren, angew~ndt z. B. bel der 
Oresdner Termlnologiedatel EWF ~, beziehen den Abfragenden eln, in- 
dem sle ihm die zus&tzllche Angabe der Anzahl der vergleichsrelevan- 
ten Zeichen abverlangen. Alle dieee Verfahren vermBgen qe erhebllch 
zu erhBhen, liefern mltunter sogar vlel zu viel Information, sis 
~ind Jedoch tells schwer theoretlsch fundierbar, tells aufwendlg in 
der Anwendun 9. 
Eine der Ursachen for geringe Antwortquote kann darln bestehen, dab 
die Arbeitsvorschrlften for die lexlko-/terminographlsche Kompila- 
tion nicht ausreichend an den Suchalgorlthmus angepaBt slnd, der far 
das zu schaffende automatlsche WBrterbuch ~orgesehen ist. Die 0bll- 
che Einsparung sprachlich regul&rer Abwandlungsformen belspielswei- 
se, die for die Benutzer des gedruckten W6rterbuchs kaum Schwierig- 
keiten mit sich bringt, darf bei programmgesteuerter Abfrage trotz 
Erh6hung des Kompilatione- und Speicheraufwanda nut So welt getrle- 
ben werden, wle es der Algorithmus zul&Et. 
Elns weitere, weltaus wenlge.r lelcht zu beherrschende Ursache llegt 
in der Synonymle, dis trotz aller BemShungen um termlnologlsche 
Standardislerung nlcht beseltlgt let und unseres Erechtens auch 
nlcht beseltigt werden kann, da ale zum Tell prinzlpielle, spPach- 
immanente Gr0nde hat. Bei der ErBrterun 9 yon Wegen, die terminologi- 
sche Synonymie in den Grill yon Algorithmen zu bekommen, gehen wlr 
yon der realen Situation aus, dab ale "Adresse" for die Abfrage yon 
Wortstellen vom 0bersetzer im allgemeinen keine metaeprachliche Be- 
grlffsbeschreibung benutzt werden kann, sondern die im Ouellente×t 
vorgefundene (oder eine ~hnliche) Benennung (melst lemmatisiert) 
herangezogen werden muB. Damit folgt die prlnzipielle NichterechlleB- 
barkelt lexikalischer Synonymle wle 'Akroleln'/'Propenal'o 'Seflor°/ 
'F~rberdlstel '4 oder 'Schraube'/'Bolzen'. Als erschlieBbar kBnntsn 
jedoch Synonymlef~lle ins Auge gefaBt werden, die durch Anwendung un- 
terschiedlicher WortbIldungsregeln auf sin und denselben Begriff 
entstanden slnd. Um des Ausma6 dleses Problems der "Wortbildungssyn= 
onymie" anzudeuten, sel eln Belspiel angef0hrt, bei dem die Wortbil- 
dungsverfahren zu einer besonders hohen Anzahl yon Varianten {0hreno 
FOr ((ein Hittel, des die Bildung eines die Ourchslchtlgkeit beein- 
tr&chtigenden Films z. B. auf einer Glasschelbe verhlndert bzw. ver- 
mindert)) wurden verschledenen WBrterb0chern und der Fachllteratur 
folgende Benennungen entnommen und durch elnlge welters regelgerech- 
te Varlanten (c) erg~nzt; Vollz~hllgkelt, falls 0berhaupt mBglich, 
wurde nicht angestrebt~ es k6nnten z. B. noch FremdwBrter benutzt 
werden: Antibeschiagmittel 
CAntischleiermittel 
BeschlagfreiausrOstung CBeschiagverhinderungsmittel 
Beschlagschutzmittel 
CEntschlelerer 
EntschZelerungsmit~el '-~sichtmtttel 
:-:i~e~ gugen Verschlei~r~i~. 
schleierd~mpfendes Hittel 
SchIeiergegenmittel 
Schleiermittel 
Schleierschu~zmitteI 
~chleierverhinderndss Mivte' CSchielerverhinderungsmittel 
schleia~verhO~endes Mit~el schleierwldrlge8 
M&t~el 
~sr:~;~isruqg~schutzmit~sl 
INFORMATIONSAUFFINDEN IN AUTOMATISCHEN WORTERBIJCHERN 261 
WEGE ZUR WORTBILDUNGSSYNONYMIE 
Zur,Grundlegung von Algortthmen, mtt denen Synonyme dteser Art als 
zus~tzltche Abfrageadressen gewonnen werden k6nnen, mOssen die Wage 
untersucht warden, die zur WortbtZdungssynonymte fOhren. 
Die Synonymenvtelfalt l~Bt stch auf mehrerlel Welse ordnen. Etn er- 
area Ordnungskrtterium ergtbt etch daraus, dab die etnzelnen Spra- 
chen h~uftg mehrere gletchberechttgte Konstrukttonswelsen berett- 
steZlen. Das begtnnt bet der Behandlung der Fuge tm Deutschen: Zwt- 
schen (~lterem) 'Aschfa11', 'Aschenfa11' und (neuerem). 'Aschefa11' 
bestehen semanttsch ketne Unterschtede. Oft spteZt es ketne Rolle, 
ob der Verbalstamm oder das Verbalsubstanttv auf '-ung' zur Wortzu- 
sammensetzung herangezogen wtrd ('Wtederholgenaulgkett' = 'Wteder- 
holungsgenautgkett'). Am anderen Rande des Bandes konstruktlver Va- 
rtabtltt&t stehen Konstrukttonssynonymenpasre aus Zusammensetzung 
o. ~. und Wortgruppe ('Handschletfen'/'Schletfen von Hand', 'Ftntte- 
Elemente-Methode'/'Methode der fintten EZemente'). Ohne fetnere Un- 
terschtede zu ber0cksichttgen, ordnen wtr die Benennungen des Bet- 
spiels: 
- K1. Zusammensetzung o. &. 
Beschlagschutzmittel 
BeschZagverhinderungsmittel 
Klarsichtmittel 
Schlelermlttel 
Schleierschutzmittel 
Schleierverhlnderungsmittel 
Verschleierungsschutzmittel 
- K2. Verwendung sines Prefixes o. ~. 
Antibeschlagmittel 
Antischlelermlttel 
Entachlelerer 
Entschlelerungsmittel 
Schlelergegenmlttel 
- K3o Verwendung eines Suffixes o. ~. 
Beschlagfrelausr0stung 
schleierwidrlgas Nittel 
- K4. Wortgruppe (auch mlt zusammengeeetzten Teilen) 
Nittel gegen Ver~chlelerung 
schlelerd~mpfendes Nittel 
achlelerverhinderndes Nittel 
schleierverh0tendes Nittel 
Eine zwelte N6glichkeit der Ordnung folgt daraus, dab vom Benennen- 
den verschiedene lexlkalisch-morphematlsche Elemente benuZzt werden, 
ohne dab er an Bedeutungsdlfferenzierung des Ganzen denkt: 
- LIo for die Erscheinungo g~gen die das Hittel wirken soll 
Beschlag 
Schleler 
- L2. for die Wlrkungsrichtung des Nittels 
anti= gegen- 
d~mpfen sch0tzen 
ant- verhindern 
-frei verh0ten 
gegen -widrlg 
-. L3o for das MiZtel 
Ausr0stung 
Miztel 
"262 G. NEUBERT " 
Bel der Ourchsicht der Varlanten fallen zw~l Blldungen - 'Klar- 
slchtmittel' und 'Schleiermlttel' - auf, for deren Deutung als re- 
gul&re WortbildungsmSgllchkeiten eln drittes Ordnungskriterium her- 
angezogen werden muB: Welche der Elements des Segrlffs sind in dle 
Benennung aufgenommen worden? Oas ((Hlttel)) wlrd spezifizlert durch 
- HI. den Vorgang bzw. das Ergebnls, der bzw. des verhindert 
werden soll+ Wlrkungsrichtung des Mlttels 
Antlbeschlagmlttel 
Antlschlelermlttel 
Verschleierungsschutzmittel 
- H2. den Vorgang bzw.. das Ergebnle, der bzw. des verhlndert 
werden soll (ohne Ausdruck der Wirkungsrlchtung des Mlttels) 
Schleiermlttel 
- M3. den Vorgang bzw. das Ergebnls, der bzw. des herbeigef0hrt 
werden soll 
Klarsichtmittel 
Obwohl alle Synonyme im lingulstischen Slnne motlviert slnd, do h. 
lhre Bestandtelle etwas 0ber dle Bedeutung des Ganzen aussagen, sind 
HaB und Art dleser Aussage verschieden. Die Motivation als Selektl- 
ons- bzw. Ellminierungsprlnzlp for Elements des Begriffs l&Bt slch 
verallgemelnert fassen, da slch elnlge allgemelng01tige Regeln her- 
ausgebildet haben 5, dle vom al!gemelnen Betrachtungsstandpunkt der 
Vertreter der einzelnen Fachgeblete bedlngt slnd. FOr des Fachgeblet 
der Technik lassen sis sich aus dem Wesen der Technlk ablelten:6 Bel 
elnem technlschen Vorgang V handelt es alch um elne T~tigkelt, die 
vom Henschen mit Hllfe sines technischen Hittels M ausgef0hrt wlrd~ 
um eln AusgangsobJekt A so zu ver~ndern, dab ein verwertbaree Ergeb- 
nleobJekt E entsteht. Die T~tlgkeit des Henschen ist begleltet yon 
der Erfassung und Beschreibung der Eigenschaften C der Vorg~nge und 
Gegenet&nde. Dle dutch GroBbuchstaben gekennzeichneten Kategorien 
verkSrpern gleicheam die begrlffllchen Bezlehungen, dle der Hotlva- 
tion bei fachlexikalischtn Wortblldungsprodukten zugrunde llegeno 
Sle lassen slch wle folgt ale System darstellen: 
H, C(H) 
I A, C(A) --V, C(V) --E, C(E) 7 
das dle funktlonsorientierte Slcht dee Technikers wledergibt. Nun 
schlleBt dle Regular±t~t der Motivation abet durchaus eln, dab un- 
terschledllche Senennungen entstehen kSnnen, denn dle Selektlon be- 
grifflicher Elements wlrd 0bet den fachlich allgemelnen Standpunkt 
hinaus yon den spezlellen Betrachtungsstandpunkten der verschiedenen 
Vertreter elnes Fachs bedlngt. Wlr wollen des an elnem Belapiel zel- 
gen, des glelchzeltlg andeuten soil, dab di~ Hotlvationssynonymie 
auch elnzelsprachliche Aspekte haben und Unterschiedllchkelt der 
Standpunkte auch unterdr0ckt werden kann. Eln engllschsprachlger 
Fachmann der Hydraullk/Pneumatik, der slch mlt der Untersuchung yon 
Flltern besch~ftlgt, wlrd for ((des ±m Filter beflndliche Element, 
dee des Filtern bewlrkt)) wahrscheinlich 'filtering element' bllden~ 
der Verwender, der dle Bautelle des Filters bei der Zerlegung zur 
S~uberung kennenlernt, blldet 'filter element'. Zm Oeutschen entste- 
hen infolge der Gle'ichhelt der wortbildungswlrkaamen Formen yon 
'flltern' und 'Filter' kelne verschiedenen Benennungen, sond~rn is- 
wells 'Filterelement', und dle speziellen Betrachtungastandpunkte 
werden (im vorliegenden Fat1) unzerdr0ckto 8 
0brlgene zelgt die Durchslcht yon Fachwortsch&tzen, dab der yon 
INFORMATIONSAUFFINDEN IN AUTOMAT1SCHEN WORTERBUCHERN 263 
elnem Mittel herbeizuf0hrende bzw. poeltlv zu beeinflussende Vorgang 
den Normalfall der MoTivation darstellt und die Synonymenanzahl in 
unserem Belsplel nut deshalb so groB let, wail slch for negative 
Wlrkungsrlchtung kslne Vorzugswortbildungsragel ausgepr~gt hat. 
BEDINGUNGEN DES ERSCHLIESSENS VON WORTBILDUNGSSYNONYMIE 
Die Synthese yon Wortbtldungsprodukten muB, gletchgOlttg ob ste tn- 
tellektuell dutch den Abfragenden oder programmgesteuert erfolgt, 
die oben eufgezetgtsn Wege nachvollztehen, die die originate Wort- 
btldung beschrettet. Daf0r mOssen folgende Voraussstzungen vorhan- 
den setn= 
- Ea m0esen die Regelwsrke der Mottvat!on in den verschtedsnen Fach- 
gebleten und der Formvsrarbettung bet der WortbtZdung~ und zwar be- 
zogen auf die auezudr0ckenden begrtffllchen Elements, f0r die etn- 
zelnen Sprschen algortthmterbar bereitsteheno 
- Es mSssen die lextkaltsch-morphematischen Baustetne der Wortbtl- 
dung vsrwsndungs~qutvalent grupptert setno 
Um dleee Vorausaetzungen zu schaffen, braucht die Ztngutstlsche For- 
schung ntcht etwa grunds~tzltch nsue Forderungen zu erf011en; sis 
muB Jedoch thre Erkenntntsee zur LSsung der Aufgaben dec automatt- 
schen Verarbettung yon Sprache aufberetteno Es zeigt etch ellerdtngs 
rasch, dab dtese Aufbereitung sowohZ von Kenntntsl0cken als auch von 
spraohltchen ProbZemsn behtndert wtrd° Insbeeondere sfnd die Mottvs- 
ttonsprtnztpten dec etnzelnen Fachgebtete etnschlte61tch dec poten- 
ttellen Betrachtungsstandpunkte wettgehend unerforscht, abet auch 
die konstrukttven Wortbtldungsregeln elnd ntcht ausrelchend den etn- 
zelnen Ausdrucksbed0rfntssen zugeordneto Die Gruppterung dec lextka- 
lisch-morphemattschen Elements macht sine spsztelle Synonymteauffas- 
sung erforderllch° Zwlschen den verschiedenen Wortbtldungsregeln 
und -mttteln bestehen zudem zahlretche wecheelsetttge Bedtngthetten, 
die emplr!sch zueammengetragen werden m0seen. 
Andererseits offenbaren sich Probleme, deren LSsung wohl vorwiegend 
odsr ausschlie61ich auf der Ebene der fachlichen Inhaite erfolgen 
kann. Dazu rechnen wir viele F~lIe des Definitionsstandpunktswech- 
eels0 z. B° auch den Obergangtzum Ausdr0cken des herbeizuf0hrenden 
anstelle des zu verhindernden Vorgenge wie im Beispielo Au6erdem 
warden durch fachinterne Gepflogenheiten z. B. beim Lexemgebrauch 
Variationsm6glichkeiten er6ffnet bzw. ausgeschlossen0 was sich einer 
Fassung in Regeln und damit einer Aigorithmierung zu entziehen 
schelnt. 
Die Sprachwissenechaft sollte sich Jedoch vom Bem0hen0 der slch ent- 
wlckelnden "Sprachtechnik" zu helfen, durch Unvollkommenhelt ihrer 
Erkenntnisee nlcht abhalten lassen, sondern zweierlei in Betracht 
ziehen: Ein Synthesealgorithmus for programmgesteuerte @Srterbuch- 
abfrage darf yon einem Grundsatz ausgehen, der beispielsweise bei 
der linguistischen Fundlerung des Sprachunterrlchts gsradezu entge- 
gengesetzt gilt - sobald nur ~le automatische Vera~beitung echnell 
genug geschieht0 spielen etw~,erzeugte ungebr~uchliche oder fehler- 
hef~e Wortbildungeprodukte keine Rolle, denn der Abfragende bemerkt 
sis nichto Zwsltens ist der Abfragende in der Lage0 die Verarbei- 
tungsergebnisse krltisch zu bewerten0 bevor er sie weiterverwendeto 
Damlt wollen wit gleichzeitlg anmerken, da6 wit belm gegenw~rtigen 
Stand nut yon interaktiven Systemsn - Systemen, in denen sich Mensch 
und Maschine wechselseitig erg~nzen - brauchbare Ergebnisse erwar- 
ten° Das trifft wahrscheinllch noch me~r auf die v6111g ausgesperte 
264 G. NEUBERT 
Problemattk der automattschen Analyse des ~bfragewort~ htnstchtlich 
setner verschiedenen Strukturen zu. 
ANMERKUNGEN 
I Wtr benutzen 'Wort' mit der pragmattschen Definition als "vom 
Obersetzer ale abfragbar bewertete sprachltche Etnhatt"o 
2 Unter Antwortquote q verstehen wir allgemetn des Vtrh~ltnis der 
Anzahl der ntcht abschl~gtg beantworteten Anfregen zur Gesamtan- 
zahl der Anfragen. Zu unterschetden ~tnd= die effekttve Antwort- 
quote qe, in die ella Antworten einbezogen sind, dt~ nOtz!tche 
Information enthalten~ dle Wortantwor~quote qw ale des Verhalt- 
nts der Anzahl der gefundenen zur Ge~a=~tanzahl der ~bgefregt~n 
Wbrter; die Bagri~fean~wortquote qb analog hin~±cht!ich der Be- 
grille. Balm zeicheF:~rouen Vergleich gilt qe = ~:~ da gen~u nut 
die WOr~sr erkannt warden, die abge~agt word®n sind° Goiingt ee~ 
ello Synonyms der AbfragewSrter zur Ab~rage zu nul:z~n, wird qe = 
qb- qe kann wetter gesteigert ~erd~n~ ~enn darOber hit=Bus ~;ni:Gr- 
etOtmende Informa~tonen sue we~teren le×ikographis:h~n Etn}~Giten 
des Spetchers bezogen ws~den kOnnen. 
3 Diese Detei tst ~us~Ohrl±ch beschr~ben In Neubert0 G~, Kukue~k~0 
H., Meyer, E., Des Da~nver~ltungssystem ~0r Fech~,ortschatze 
EWF, in: Neubert, Go (Hrsgo), R~chnerunterst0tzun 9 hal dar Be~r~ 
beltung fachlex±kal±ocher Probl~mo (VEB Verlag En~yklopEdle 
Leipzig, 1981). 
FOr den ersten F~II exist!eft sine me~a~prachli~he 3eschreibung 
in Gestalt der chem!~che~ Symboldav~¢eilung~ CH2=CP~HO; ?0r d~n 
zwelten kOnnte die bot~nischo Num~nklaturbenonnung C~r~hsmos 
tlnctorlue L. al~ ~olche angesehen warden. Xhre Nutzung ale Ab= 
frageadresse set~t versus, de6 sie dam 0bersaZzer bekannt slnd~ 
5 ~usf0hrlich dazu Reinhardt, W.0 Produktive Wor~blld~ngsmodel~ 
im ~echnischen F~chwortschatz de~ Oeut~chen~ Dlss. B, Pad° Hoch-, 
sch. Potsdam, 1973° 
6 Vgl. hlerzu Neubtrt, Go° Des Ho¢ivation~prinzip be± ~aehlexikali~ 
schen Elnhetten am Betspiel des Wortsch~tzes der Hydreultk/Pneu- 
matik, Dtss. B, Techn. Unlvers. Dresd3n, 1978. 
7 Des System let nlch~ vollstandlg dargee~sllt; so daz~ die L~tera~ 
fur in den Anmerkungen 5 und suofOhrlich~r noah 6. 
8 Nut zur Verdeutlichu~g: Ware im Deutschen ~= Fachgebzet d~r Hy- 
draul!k/Pneumetik 'filtrleren' anetel!e °~i!¢ern' Cblich° erga- 
ben slch 'Flltrlerelei~ent' und °Flitriere~slemenz=~ 
