Supercomputer soll TV-Show gewinnen

“Jeopardy” ist eine weltweit sehr beliebte Quiz-Show bei der Fragen aus den Bereichen Geschichte, Literatur, Kunst, Pop-Kultur, Film, Wissenschaft und Geographie zu beantworten sind. Zwei Besonderheiten prägen diese Show: Erstens, der Kandidat muss aus einer Kategorie den Schwierigkeitsgrad – das heißt, den eingesetzten Betrag auswählen. Je höher der Betrag, je schwieriger die Frage. Zweitens, es wird eine Antwort präsentiert und die Kandidaten müssen die zugehörige Frage abgeben. Beispiel: “Der Gründer der USA; der übrigens niemals einen Kirschbaum gefällt hat.” Richtige Antwort-Frage: “Wer war George Washington?”

“Schon diese beiden Vorgaben machen es für eine Software besonders schwierig, denn das System muss seine eigene Wissensqualität im Vergleich zu den anderen Kandidaten einschätzen und anschließend aus der gegebenen Antwort eine grammatikalisch korrekte Frage formulieren”, sagt David Ferrucci, IBMs Projektleiter. Hinzu kommt dann noch der Zeitdruck, denn die Antwort muss in fünf Sekunden gegeben werden. Außerdem besteht hier noch ein weiteres Computer-spezifisches Problem, dass nämlich die komplette Kommunikation in natürlicher Sprache abläuft.

Damit ist der Computer zunächst gegenüber seinen menschlichen Konkurrenten unterlegen, die wesentlich schneller den Kontext der Aufgabe verstehen – auch wenn darin Ironie, Wortspiele oder andere Sprachtricks enthalten sind. Die Zeit, die der Computer für das Verstehen der Frage und für das Formulieren seiner Antwort benötigt, geht von den fünf Sekunden ab, sodass immer weniger Zeit für die eigentliche Lösung zur Verfügung steht.

Im Gegensatz zu Deep Blue bewegt sich Watson also nicht im Rahmen von strengen formalen Regeln, so wie es beim Schachspiel der Fall ist, sondern im Bereich von Analysen und Bewertungen von riesigen unstrukturierten Datenmengen. “Der Umgang mit Mehrdeutigkeiten und Wahrscheinlichkeiten beherrscht die angewandten Algorithmen”, erläutert Ferrucci. Bei jeder Frage werden hunderte Algorithmen gleichzeitig gestartet. Je mehr Algorithmen unabhängig zur gleichen Lösung kommen, umso höher stuft das System die Wahrscheinlichkeit ein, dass es die richtige Antwort gefunden hat.

Watson soll bei seinen Antworten auch von den äußeren Rahmenbedingungen weitestgehend mit seinen Gegenspielern übereinstimmen. Das heißt, es ist ein Stand-alone-System, das keine Verbindung zur Außenwelt oder zum Internet hat. Das gesamte Wissen und alle Algorithmen sind innerhalb des Systems abgespeichert – allerdings nicht ganz so kompakt, wie bei den menschlichen Konkurrenten. So enthält das System Millionen an Text-Dokumenten, einschließlich Wörterbüchern, Enzyklopädien, wie beispielsweise Wikipedia, hinzukommen Bibel, Novellen, Filmmanuskripte und Theaterstücke.

Zum Einsatz kommt ein Blue-Gene Supercomputer mit massiv-paralleler Verarbeitung. Diese Systeme erreichen eine Dauerrechengeschwindigkeit von mehreren Petaflops. Das System Blue-Gene/P erreicht mit 294.912 Prozessoren, die über optische Leiter verbunden sind, eine Spitzengeschwindigkeit von 3 Petaflops.

Die endgültige Watson-Konfiguration steht noch nicht fest. Derzeit befindet sich das System im Feintuning. Das heißt, der Computer spielt im Labor gegen frühere Jeopardy-Gewinner. Ziel ist es, eine Trefferquote von 80 bis 90 Prozent zu erreichen.

Falls alles nach Plan verläuft, soll dieser Wert noch in diesem Jahr erzielt werden, sodass anschließend der erste Live-Auftritt vor laufender Kamera stattfinden kann.

Silicon-Redaktion

Recent Posts

Microsoft Teams in der öffentlichen Verwaltung

Land Niedersachsen schließt datenschutzrechtliche Vereinbarung mit Microsoft zur Nutzung von Teams ab.

4 Stunden ago

Diebstahlsicherung mit KI

Ein Großteil der Inventurdifferenzen im deutschen Einzelhandel wird durch Ladendiebstähle verursacht.

4 Stunden ago

Neue, aggressive Wellen an DDoS-Attacken

DDoS-Angriffe haben seit dem Beginn des Krieges zwischen Russland und der Ukraine an Häufigkeit und…

2 Tagen ago

Excel als Rückgrat deutscher Lieferkettenplanung

Lieferkettenplanung in Deutschland auf Basis von Excel bei 37 Prozent der befragten Unternehmen im Einsatz.

4 Tagen ago

Siemens automatisiert Analyse von OT-Schwachstellen

Bedienpersonal von Fertigungsanalagen soll mögliche Risiken auch ohne Cybersecurity-Fachwissen erkennen und minimieren können.

5 Tagen ago

Cyberabwehr mit KI und passivem Netzwerk-Monitoring

Schiffl IT: Anomalien im Netzwerkverkehr und in den Systemen in Echtzeit identifizieren.

1 Woche ago