Fraunhofer-Forscher basteln am semantischen Web

Auf der CeBIT (4. bis 9. März) stellen Fraunhofer-Institute neue Suchlösungen vor.

Diese zielen auf die Zusammenhänge zwischen gesuchten Begriffen oder die Bedeutung eines ganzen Satzes – die Semantik. Die Suchprogramme von Google, Yahoo oder MSN verstünden dagegen nur einen Begriff, heißt es von den Forschern. Für sie mache es keinen Unterschied, ob der Rechercheur mit der Eingabe ‘Netz’ ein Spinnennetz, das Internet oder das Schienennetz der Bahn meine.

Im Verbundprojekt ‘Wikinger’ unter der Leitung des Fraunhofer-Instituts für Intelligente Analyse- und Informationssysteme IAIS in Sankt Augustin arbeiten Informatiker, Ingenieure und Geschichtswissenschaftler daran, Suchanwendungen ein höheres Maß an Textverständnis beizubringen. Dazu setzen sie Methoden ein, mit denen Wissen über Beziehungen in den Dokumenten erschlossen werden kann – etwa dass der Begriff Netz sowohl mit ‘Neuen Medien’, ‘Natur’ oder ‘Verkehr’ in Verbindung gebracht werden kann.

So kann die Wissensplattform halbautomatisch selbst semantische Netze entwickeln, die dem Nutzer das gezielte Recherchieren erleichtern. “Diese Technologie ist für die Erschließung von Textarchiven geeignet, etwa in Zeitungsverlagen”, sagte Projektleiter Lars Bröcker vom IAIS.”Sie kann aber überall genutzt werden, wo große Datenbanken durchsucht oder multimediale Daten verknüpft werden, um neues Wissen zu erhalten.”

Auf die Probleme mittelgroßer oder großer Firmen ist die Suchmaschine ConWeaver zugeschnitten, die eine Arbeitsgruppe des Fraunhofer-Instituts für Graphische Datenverarbeitung IGD in Darmstadt unter Leitung von Thomas Kamps entwickelt hat. In vielen Unternehmen verschwendeten Mitarbeiter Arbeitszeit mit dem Durchforsten von Kunden-, Lieferanten- und Expertendatenbanken oder von Textdokumenten, um bestimmte Informationen herauszufiltern, hieß es. ConWeaver ermögliche es dagegen, heterogenes Firmen-Know-how automatisch zu vernetzen und für Geschäftsprozesse nutzbar zu machen. 

Dabei beziehe ConWeaver nicht nur den vom Nutzer eingegebenen Begriff in die Suche ein, sondern auch dessen Übersetzung in andere Sprachen sowie thematische Zusammenhänge. Sie erzeuge aus den Unternehmensdaten automatisch ein semantisches Wissensnetz. So erkenne ConWeaver etwa, dass das Wort ‘Kunde’ in der Vertriebsdatenbank gleichbedeutend ist mit ‘Customer’ im E-Mail-Archiv und ‘Auftraggeber’ in der Projektdokumentation. “Im Gegensatz zu herkömmlichen Suchmaschinen erzeugt ConWeaver einen Zusammenhang zwischen den unterschiedlichsten Datenformaten”, so Kamps. “Dadurch kann die Software sowohl unstrukturierte als auch strukturierte Informationsquellen effizient durchsuchen.”

Ein Team um Jörn Kohlhammer am IGD arbeitet zudem daran, die automatische Datenanalyse mit neuen Techniken zur Visualisierung zu verbinden. Die Forscher nutzen dabei die unterschiedlichen Fähigkeiten von Computer und Mensch. Der Rechner ist zuständig für die sequentielle Abarbeitung großer Datenmengen und deren Verwandlung in eine für den Menschen erfassbare optische Darstellung.

Der Mensch kann sich auf die Erkennung von Mustern, die Bewertung und die Auswertung der betrachteten Daten konzentrieren. Kohlhammer: “Es handelt sich hier um eine sehr enge Arbeitsteilung zwischen Mensch und Computer, wobei der Mensch im Vordergrund steht. Nicht das System entscheidet, sondern immer der Nutzer.”

Die Visualisierungen seien etwa für Finanzdienstleister interessant, hieß es. Hier seien die Daten meist so umfangreich und vielfältig, dass eine aussagekräftige Bewertung auf die Schnelle unmöglich ist. Visuelle Darstellungen erleichterten den Überblick: Werden dem Analysten auf dem Bildschirm die Auswertung der Beteiligungsstrukturen von Unternehmen nicht mehr als Zahlentabellen, sondern in Form intuitiv erfassbarer Strukturen dargestellt, kann er daraus schnell und gezielt Schlüsse ziehen.

Andere Visualisierungstechniken erlaubten es, die Aktienkurse vieler Unternehmen gleichzeitig zu beobachten und Schlüsse aus der vergangenen Entwicklung zu ziehen. So kämen oft Korrelationen optisch zum Vorschein, die sonst im Zahlenwust untergehen würden. Die neuen Data-Mining- und Visual Analytics-Verfahren zeigen die Wissenschaftler auf der CeBIT in Halle 9, Stand B36.