Theseus erfolgreich abgeschlossen

Fünf Jahre lang lief Theseus – das größte ITK-Forschungsprogramm in der deutschen Geschichte. Jetzt traf man sich in Berlin zum Abschlusskongress. Theseus hatte ein Volumen von 200 Millionen Euro, die zur Hälfte vom BMWi und von Partnern aus Industrie und Forschung aufgebracht wurden.

“Es sind zahlreiche Patente, innovative Geschäftsmodelle, neuartige Dienste und Technologien entstanden, die besonders kleinen und mittelständischen Unternehmen enormes Potenzial bieten”, sagte Prof. Dr. Hans-Jörg Bullinger, Präsident der Fraunhofer-Gesellschaft. Dabei habe sich Theseus auf standortstarke Wachstumsfelder wie Software, Medizintechnik und Medien konzentriert.

Die Bilanz des Projektes sieht nach eigenen Angaben so aus:

Aktivität
Anzahl
Gegründete Unternehmen 5
Umgesetzte Standardisierungsaktivitäten 19
Initiierte Entwicklungspartnerschaften 19
Eingeworbene Anschlussprojekte 29
Angemeldete Patente und andere geschützte Ergebnisse 50
Entwickelte Prototypen 130
Veröffentlichte Publikationen 1100

Ein Ziel des Forschungsprogramms war es, das Wissen der analogen Welt in Dateien umzuwandeln und so für das Internet überhaupt erst verfügbar zu machen. Das gilt für Bücher und Zeitungen, für Audio- und Videoaufnahmen und auch für Filmrollen, die zu Hunderttausenden in Archiven lagern. In Theseus wurden Verfahren erarbeitet, die diese analogen Datenträger schnell digitalisieren und analysieren. Das ist wichtig, denn bislang gibt es von den wenigsten Dokumenten oder historischen Kunstschätzen Digitalkopien.

Bild: Theseus

Allein für die Deutsche Digitale Bibliothek (DDB) – ein öffentlich gefördertes Projekt, das Kunstwerke, Literatur oder Film- und Tonaufnahmen aus rund 30.000 deutschen Museen und Sammlungen verfügbar machen soll – müssen Hunderttausende Kleinodien erfasst werden. Auch die DDB setzt auf die neue Digitalisierungs-Technologie. Dazu gehören Archivierungs-Programme, die den Inhalt der Medien automatisch verschlagworten und so kodieren, dass Internet-Programme darauf zugreifen können – zum Beispiel in Form von Videos im MPEG4-Standard.

Die neuen Technologien können künftig auch Ärzten helfen. Ultraschall oder Computertomographie sind wichtige Grundlagen für die medizinische Diagnose und Therapie. Bislang gibt es allerdings kein Instrument, das all die damit verbundenen heterogenen Informationen – wie Texte, Bilder oder Labordaten – intelligent strukturiert und zugänglich macht. Im Theseus-Anwendungsszenario MEDICO arbeiteten Forscher daran, diese Lücke zu schließen.

Zu den Theseus-Erfindungen gehört auch die semantische Suchmaschine Quote. Diese ermöglicht es, Zitate von Personen des öffentlichen Interesses zu recherchieren. Als mobil verfügbare Suchmaschine und Überblickshilfe soll Quote in den Bereichen Medien, Öffentlichkeitsarbeit, Sponsoring und Personalmanagement genutzt werden. So kann der User innerhalb der Applikation bestimmten Personen “folgen” oder nach Themen suchen und erhält die letzten Zitate von Personen zum jeweiligen Thema.

Technisch vereint Quote semantische Analysemethoden, die im Theseus-Programm und im Anwendungsszenario Contentus entwickelt wurden: Ein ‘Named Entity Recognizer’ stellt beispielsweise fest, ob das Wort “Becker” etwa für Boris Becker steht oder für einen anderen Herrn Becker. Zudem ist es möglich, einen Steckbrief für Personen zu erstellen, indem aufgezeigt wird, zu welchen Themen die Person in letzter Zeit zitiert wurde.

Der spezielle ‘Topic Modeling’-Algorithmus erstellt dafür ein Themenspektrum aus den Dokumenten der beobachteten Personen. Der ‘Quote Detector’-Algorithmus erkennt die Muster typischer Zitate und extrahiert wahrscheinliche Zitate zu bestimmten Personen aus der bislang mit mehreren 10.000 Nachrichtenartikeln gefüllten Datenbank von Quote. Clustering-Algorithmen verhindern, dass Duplikate entstehen.

Quote befindet sich derzeit am Fraunhofer IAIS in der abschließenden Entwicklung. Bis zur CeBIT wird die Applikation mit weiteren Datenquellen und Analysemöglichkeiten ausgestattet werden und dann erstmals der Öffentlichkeit präsentiert.

Bild: mufin GmbH
Bild: mufin GmbH

Im Theseus-Programm wurde auch am mufin Player gearbeitet – einer Abspiel-Software, die in der Lage ist, Eigenschaften von Musikstücken zu erkennen und so dem Nutzer auf Klangähnlichkeiten basierende Empfehlungen zu geben.

Die Anwendung Analyze von Attensity durchsucht das Social Web mit Hilfe von semantischen Technologien nach relevanten Nutzerkommentaren, zum Beispiel zu einem Mobiltelefon. Aus den Ergebnissen erstellt die Software eine Zusammenfassung, die Unternehmen Rückschlüsse auf die Kundenzufriedenheit und die Produktqualität erlaubt.

Ein Beispiel ist auch die Information Workbench von fluid Operations. Hier werden Technologien des Forschungszentrum Informatik genutzt, um Unternehmen eine Lösung für ihr Informationsmanagement anzubieten. Nach Angaben des Herstellers wird damit zum Beispiel die frühzeitige Fehlererkennung in komplexen Rechenzentren möglich.

Als Katalysator für das Internet der Zukunft soll die Unified Service Description Language (USDL) dienen. Mit ihr wird es möglich, Dienstleistungen einheitlich und für Mensch und Maschine gleichermaßen verständlich zu beschreiben. Online-Services können wie Güter gehandelt und kombiniert werden.

“Theseus hat einiges zusammengebracht”, sagte Prof. Dr. Henning Kagermann im Dezember 2011 gegenüber dem IT-Gipfelblog. Die Frage sei jetzt, ob man es schaffe, genügend Anwender für die entwickelten Techniken zu gewinnen.



Auf der CeBIT präsentiert sich Theseus mit seinen Projektpartnern auf dem Stand des BMWi sowie auf dem ‘CeBIT lab’ in Halle 9. Wer nicht in Hannover sein kann, kann Theseus auch per kostenloser iPad-App näher betrachten.