NAT URLICHSPRAC HIGE PROB LEMB ESC HREIB UNG ALS EIN VERFAHREN 
FOR DEN B~JlKGERNAHEN ZUGANG ZU DOKUMENTATIONSSYSTEMEN 
Harald H. Zimmermann 
Regensburg 
Ab s trakt 
Die rasche Entwicklung der neuen Kom- 
munikations-Medien die Bilds chirmtext, 
Zweiweg-Kabelfernsehen, aber auch der 
preiswerte Zugang zu Informationssystemen 
iiber Paketvermittlungsnetze erSffnet zuneh- 
mend die M6gliehkeit der Anbindung welter 
Bev~ikerungskreise an Informations- und 
Dokumenta tions s ys teme. 
Die Computerlinguistik, besonders die 
Grundlagenforschung im Bereich der KUnst- 
lichen Intelligenz, besch~ftigt sich seit vielen 
Jahren bei zunehmender Tendenz mit Fragen der 
l~epr~sentierung und Erschlie\[3ung yon in 
natfirlichsprachiger Form gespeichertem 
Wissen. Dies geschieht einerseits in der 
Absicht, Erkenntnisse ilber die Funktion und 
das Funktionierenvon Sprache zu gewinnen, zu 
vertiefen und zu erproben, andererseits abet 
auch in der Absicht, solche Verfahren - etwa 
im Rahmen yon Frage-Antwort-Systemen - 
(zumeist modellhaft) in Anwendung zu bringen. 
Derartige Verfahren sind jedoch derzeit nut 
filr sehr enge Themenbereiche - und auch hier " 
nur mit Einschrgnkungen - anwendbar. Eine 
Ausdehnung auf grSI~ere 'Welten' oder Welt- 
ausschnitte scheitert zumindest an dem gro\[Sen 
intellektuellen Aufwand, der fiir eine ent- 
sprechend tiefe und umfassende Wissensauf- 
bereitung erforderlich ist. 
Dem gegeniiber steht inzwischen ein er- 
heblicher Bedarf an Informationssystemen, die 
vom ungeiibten Biirger ohne grS\[3ere technische 
und formale Schwierigkeiten bedient werden 
k~nnen, also nicht - wie bisher - einen System- 
spezialisten als Vermittler einschalten. Dazu 
bietet sich heute u.a. eine Bedienerfiihrung 
~iber den sog. graphischen Dialog oder iiber 
die Meniitechnik als Auswahl- und Entschei- 
dungsverfahren an. Derartige Verfahren sind 
jedoch nicht immer ausreichend flexibel und 
zudem langwie rig. 
\]Eine Alternative im \]Bereich des R.eferenz- 
retrieval stellt die natiirlichsprachige Pro- 
blembesehreibung dar, wie sie im P~egensburger 
System JUDO (ffir 'juristische Dokumentbesch- 
reibung', hergeleitet aus dem Anwendungs- 
bereich (Datenschutz-l~eeht)) integriert ist; 
Die 'Suchfrage 't beim Dokument-l~etrieval 
besteht aus einem oder mehreren (Teil-) 
S~itzen. 
Die S~tze werden iiber linguistische und z. T. 
probabilistische maschinelle Verfahren in der 
gleichen Weise bearbeitet, wie zuvor die 
Dokumente der Datenbank. Auf diese Weise 
wird zugleich eine Homogenisierung der 
Dokumente rs chlie\[~ung (Indexierung) und de r 
Dokumentidentifikation (l~etrieval) erreicht: 
Dazu werden u.a. Paraphrasierungen/ 
Normierungen vorgenommen und Thesaurus- 
relationen herangezogen. 
W~hrend der Textanalyse wird versucht, 
syntaktische und semantische Mehrdeutig- 
keiten aufzulSsen. Dazu wird u.a. die sog. 
' Saarb riicke r Automatis che Textanalys e (SATAN) 
verwendet; die Informations-Retrieval-Systeme 
TELDOK und GOLEM dienen z. Zt. als 
Implementie rung s grundlage der Re trieval- 
Komponente. Folgende Fragen werden im 
B.eferat - belegt durch Beispiele und Statistiken 
- behandelt: 
o Texterstellung und -aufbereitung, Textbasis, 
Dokumenttypen; 
o Allgemeinsprachliehe und fachspraehliche 
maschinelle Analyse ; 
o Deskriptoren (einfache/komplexe Desk- 
riptoren); 
o Thesauruserstellung und -relationen; 
o Natilrlichsprachliche Problembeschreibung, 
besonders Probleme der Paraphrasierung. 
Den Abschlu\[3 bildet ein Ausblick auf noch 
zu 15sende Fragen und auf Anwendungsmtiglich- 
keite-n, auch im Hinblick auf die Ubertragbar- 
keit auf andere Themenbereiche.  
