TU-Informatiker arbeiten an intelligenter Suchsoftware

In einem Projekt an der TU Darmstadt arbeitet ein Team von Informatikern an Software, die in natürlicher Sprache gestellte Fragen, beantworten soll.

“Was schützt meinen Computer vor Trojaner-Attacken?” oder “Wie finde ich einen guten Kindergarten?” – herkömmliche Suchmaschinen liefern oftmals Tausende Webseiten auf eine Frage. Darin die gesuchte Antwort zu finden, bleibt dem Suchenden überlassen. Obwohl fast alle Internet-Nutzer Suchmaschinen benutzen, finden nur wenige die relevanten Informationen beim ersten Suchversuch.

Kollaborativ erstellte Frage-Antwort-Plattformen im Web 2.0 können das nach Meinung von Darmstädter Informatikern ändern. In diesen Plattformen fänden sich selbst auf schwierigste Fragen Antworten höchster Qualität, hieß es. Die Popularität von Frage-Antwort-Plattformen, wie beispielsweise Yahoo!Answers, WikiAnswers oder AnswerBag, sei beachtlich. So zähle WikiAnswers mittlerweile mehr als eine Million Fragen, die in verschiedene inhaltliche Kategorien eingeteilt sind.

Doch die Suche nach Antworten in diesen Frage-Antwort-Wissensspeichern sei immer noch eine Suche nach der Nadel im Heuhaufen. Zum einen mache es die Menge an Informationen dem Nutzer schwer, dort zu navigieren. Zum anderen würden inhaltlich identische oder sehr verwandte Fragen oft in unterschiedliche Worte gefasst und könnten deshalb mit herkömmlichen Suchmaschinenverfahren nicht gefunden werden.

In dem Forschungsprojekt wollen sich die Wissenschaftler des ‘Ubiquitous Knowledge Processing Lab’ (UKP) an der TU Darmstadt dieser Herausforderung annehmen. Sie entwickeln intelligente Algorithmen im Bereich der automatischen Sprachverarbeitung, die unterschiedlich formulierte Fragen mit ähnlicher Bedeutung in den Frage-Antwort-Plattformen automatisch aufspüren.

Existiert bereits eine Antwort auf die gestellte Frage, wird diese dem Fragesteller unmittelbar angezeigt. Sollte eine Frage noch nie beantwortet worden sein, werden elektronische Dokumente im Internet durchsucht, um die Antworten dort aufzuspüren. Dabei werden verschiedene Wörter, die das Gleiche bedeuten, auf einen Suchbegriff abgebildet. Fragt etwa der Suchende nach “einem Programm, um den Computer vor Viren zu schützen”, werden relevante Dokumente zurückgeliefert, die den Begriff “Antiviren-Software” enthalten.

Um die menschliche Sprachintelligenz nachzubilden, werten die Darmstädter Forscher kollaborativ erstellte Web 2.0-Wissensquellen automatisch aus – wie die Online-Enzyklopädie Wikipedia oder das multilinguale Wörterbuch Wiktionary – und machen das daraus destillierte Wissen den Sprachanalyseprogrammen zugänglich.

Das vor wenigen Monaten begonnene Projekt wird von der Computerlinguistin Iryna Gurevych geleitet. Die 31-Jährige Wissenschaftlerin ist Leiterin des UKP Labs im Fachbereich Informatik der TU Darmstadt. Das Projektteam besteht übrigens ausschließlich aus Frauen – ungewöhnlich in einem technischen Fach.