Microsoft entwickelt Simultanübersetzer

Eine neue Microsoft-Technologie übersetzt das gesprochene Wort nicht nur in Echtzeit von einer Sprache in eine Andere, sondern tut dies auch noch mit der Stimme des Sprechers.

Schon vor einigen Tagen hatte Microsoft bei einer Technologie-Konferenz das System vorgestellt. Dabei hatte der Microsoft-Chefentwickler Rick Rashid einen englischen Text von dem System in Echtzeit ins Chinesische übertragen. Und das Simltanübersetzer-System tat dies auch mit dem Klang seiner Stimme.

Dafür hätte Rashid zuvor rund eine Stunde lang das System trainieren müssen. Wie er in seinem Blog erklärt, geht diese neue Spracherkennung in zwei Stufen vor sich. Zunächst übersetzt die Software die gesprochenen Worte. In einem zweiten Schritt sorgt das System dafür, dass daraus auch ein vernüftiger Satz wird. Rashid erklärt, dass hier die größere Schwierigkeit für die Entwickler lag.

Zusammen mit der Universität Toronto habe Microsoft daher eine Technologie mit dem Namen Deep Neural Networks entwickelt. “Die ist nach dem Muster des Verhaltens des menschlichen Gehirns gestaltet”, so Rashid. So seien die Forscher in der Lage gewesen, die Fehlerrate in dem Simultanübersetzer um rund 30 Prozent zu senken, weil so sprachliche Zusammenhänge besser als mit anderen Systemen erkennt werden können.

Das bedeute, dass nicht jedes 4. Oder 5. Wort falsch ist, sondern nur noch jedes 7. oder 8. “Das ist weit davon entfernt, eine perfekte Übersetzung zu liefern und es muss noch viel daran gearbeitet werden, aber die Technologie ist dennoch sehr vielversprechend. Wir hoffen daher, in einigen Jahren die Sprachbarrieren durchbrechen zu können. “Mit anderen Worten”, so Rashid in seinem Blog, “wir werden nicht mehr bis zum 22. Jahrhundert warten müssen, bis wir so etwas wie den Universalübersetzer haben, den wir aus Star Treck kennen.”