Supercomputer soll TV-Show gewinnen

CloudEnterpriseServer

Als der Supercomputer Deep Blue vor drei Jahren den amtierenden Schachweltmeister Garry Kasparow schlug, machten IBMs Experten für Künstliche Intelligenz (KI) weltweit Schlagzeilen. Nun legen sie nach und lassen den neuen Computer “Watson” in einer TV-Quizshow antreten.

“Jeopardy” ist eine weltweit sehr beliebte Quiz-Show bei der Fragen aus den Bereichen Geschichte, Literatur, Kunst, Pop-Kultur, Film, Wissenschaft und Geographie zu beantworten sind. Zwei Besonderheiten prägen diese Show: Erstens, der Kandidat muss aus einer Kategorie den Schwierigkeitsgrad – das heißt, den eingesetzten Betrag auswählen. Je höher der Betrag, je schwieriger die Frage. Zweitens, es wird eine Antwort präsentiert und die Kandidaten müssen die zugehörige Frage abgeben. Beispiel: “Der Gründer der USA; der übrigens niemals einen Kirschbaum gefällt hat.” Richtige Antwort-Frage: “Wer war George Washington?”

“Schon diese beiden Vorgaben machen es für eine Software besonders schwierig, denn das System muss seine eigene Wissensqualität im Vergleich zu den anderen Kandidaten einschätzen und anschließend aus der gegebenen Antwort eine grammatikalisch korrekte Frage formulieren”, sagt David Ferrucci, IBMs Projektleiter. Hinzu kommt dann noch der Zeitdruck, denn die Antwort muss in fünf Sekunden gegeben werden. Außerdem besteht hier noch ein weiteres Computer-spezifisches Problem, dass nämlich die komplette Kommunikation in natürlicher Sprache abläuft.

Damit ist der Computer zunächst gegenüber seinen menschlichen Konkurrenten unterlegen, die wesentlich schneller den Kontext der Aufgabe verstehen – auch wenn darin Ironie, Wortspiele oder andere Sprachtricks enthalten sind. Die Zeit, die der Computer für das Verstehen der Frage und für das Formulieren seiner Antwort benötigt, geht von den fünf Sekunden ab, sodass immer weniger Zeit für die eigentliche Lösung zur Verfügung steht.

Im Gegensatz zu Deep Blue bewegt sich Watson also nicht im Rahmen von strengen formalen Regeln, so wie es beim Schachspiel der Fall ist, sondern im Bereich von Analysen und Bewertungen von riesigen unstrukturierten Datenmengen. “Der Umgang mit Mehrdeutigkeiten und Wahrscheinlichkeiten beherrscht die angewandten Algorithmen”, erläutert Ferrucci. Bei jeder Frage werden hunderte Algorithmen gleichzeitig gestartet. Je mehr Algorithmen unabhängig zur gleichen Lösung kommen, umso höher stuft das System die Wahrscheinlichkeit ein, dass es die richtige Antwort gefunden hat.

Watson soll bei seinen Antworten auch von den äußeren Rahmenbedingungen weitestgehend mit seinen Gegenspielern übereinstimmen. Das heißt, es ist ein Stand-alone-System, das keine Verbindung zur Außenwelt oder zum Internet hat. Das gesamte Wissen und alle Algorithmen sind innerhalb des Systems abgespeichert – allerdings nicht ganz so kompakt, wie bei den menschlichen Konkurrenten. So enthält das System Millionen an Text-Dokumenten, einschließlich Wörterbüchern, Enzyklopädien, wie beispielsweise Wikipedia, hinzukommen Bibel, Novellen, Filmmanuskripte und Theaterstücke.

Zum Einsatz kommt ein Blue-Gene Supercomputer mit massiv-paralleler Verarbeitung. Diese Systeme erreichen eine Dauerrechengeschwindigkeit von mehreren Petaflops. Das System Blue-Gene/P erreicht mit 294.912 Prozessoren, die über optische Leiter verbunden sind, eine Spitzengeschwindigkeit von 3 Petaflops.

Die endgültige Watson-Konfiguration steht noch nicht fest. Derzeit befindet sich das System im Feintuning. Das heißt, der Computer spielt im Labor gegen frühere Jeopardy-Gewinner. Ziel ist es, eine Trefferquote von 80 bis 90 Prozent zu erreichen.

Falls alles nach Plan verläuft, soll dieser Wert noch in diesem Jahr erzielt werden, sodass anschließend der erste Live-Auftritt vor laufender Kamera stattfinden kann.