Suchmaschine ermöglicht Stöbern in Web-Vergangenheit

EnterpriseMarketingNetzwerk-ManagementNetzwerkeProjekteService-ProviderSoftwareSoziale NetzeZusammenarbeit

Forscher an der University of Washington (UW) arbeiten an einer Anwendung namens ‘Zoetrope’, die neue Möglichkeiten bei der Web-Suche verspricht. Das Werkzeug ist dazu gedacht, nicht einfach aktuelle Inhalte im Web zu finden, sondern in der Vergangenheit dynamisch veränderlicher Webseiten nach Daten zu forschen.

Das Team der Forscher an der UW kann bereits auf erste Ergebnisse verweisen. “Zoetrope lässt Anwender dabei Informationen tatsächlich im Kontext einer Webseite suchen”, betonte UW-Computerwissenschaftler Eytan Adar. Die Entwicklung setzt dazu auf regelmäßige Schnappschüsse des Zustands von Webseiten als Datenquelle. Sie soll sich aber deutlich von bisherigen Angeboten zur Nachforschung im historischen Web wie der Wayback Machine des Internet Archive abheben.

Im modernen Web sehen Nutzer nur den aktuellen Ist-Zustand von Webseiten, in dem mit verschiedensten Werkzeugen Daten gesucht, manipuliert und visualisiert werden können. “Da ist es schon irgendwie überraschend, dass es keine vergleichbaren Möglichkeiten für das vergängliche Web gibt”, so Dan Weld, Professor für Computerwissenschaften an der UW. Das wollen die Forscher mit Zoetrope ändern und dabei auch deutlich über einfache Stichwortsuchen hinaus gehen. “Bei Zoetrope kann der Nutzer ‘Linsen’ auf Bereiche der Webseite zeichnen, um dadurch Fragen zu historischen Inhalten zu stellen”, erklärte Adar. Wer sich etwa für Verkehrsentwicklung interessiert, könne leicht alte Versionen einer entsprechenden Webseite ansehen und die Daten auch visualisieren. Auch ein Quervergleich verschiedener Webseiten ist mit Zoetrope möglich, beispielsweise von Öl- und Benzinpreisen mit entsprechenden Nachrichtenmeldungen.

Die Forscher hoffen, Zoetrope bereits im kommenden Sommer frei verfügbar machen zu können. Die historische Web-Suche soll möglichst als Browser-Plug-in oder Software-as-a-Service angeboten werden. “Das ideale Anwendungsszenario wäre, dass Anwender ganz normal im Web surfen und bei Bedarf Fragen zu historischen Informationen stellen können, ohne den Browser zu verlassen”, erklärt Adar auf Nachfrage von pressetext. Vorstellbar ist den Forschern zufolge beispielsweise ein Schieberegler, mit dem Nutzer einfach immer weiter in die Vergangenheit einer Webseite spähen können. Derzeit speichert Zoetrope stündlich Schnappschüsse von rund 1000 verschiedenen Webseiten. Adar will eruieren, wie das Programm auf das gesamte Web ausgeweitet werden kann und arbeitet auch daran festzustellen, wie regelmäßig verschiedene Seiten gespeichert werden müssen. Langfristig könnte Zoetrope das aufgrund der Aktualisierungsfrequenz von Webseiten automatisch bestimmen.

Eine Einschränkung von Zoetrope ist, dass erst seit rund vier Monaten Daten gesammelt werden. “Wir würden sehr gerne Zoetrope mit den Daten der Wayback Machine integrieren”, meint Adar daher zu pressetext. Es müssten aber wohl diverse Copyright-Fragen geklärt werden, um diesen Datenschatz nutzen zu können. Das Internet Archive sammelt bereits seit 1996 historische Webdaten und hat Schnappschüsse von 85 Milliarden Webseiten, die im heutigen Web teils gar nicht mehr existieren. Ein wirklich effizientes Werkzeug zum Durchforsten und Auswerten dieser Datensammlung ist die Wayback Machine allerdings nicht, da sie lediglich den Aufruf einzelner Schnappschüsse einer bekannten URL erlaubt.