Google verbindet mit “Spanner” Datenbank, GPS und Atomuhr

Mit einer neuen Datenbank-Technologie will Google eine global verteilte Datenbank entwerfen, die auch über große Entfernungen kaum Latenzzeiten aufweist.

Schematische Darstellung von Googles ‘Spanner’-Echtzeitdatenbank-Technologie. Quelle: Google

Für die neue Datenbank-Technologie Spanner zieht Google neben berühmten  Entwicklern auch Atomuhren und GPS-Geräte heran. In einem umfassenden Paper beschreibt der Internet-Gigant die Technologie, als das “erste System, das Daten auf globaler Ebene verteilt und das auch extern konsistente Transaktionen unterstützt”.

Es ist also in groben Worten gesprochen, eine Datenbank, die es ermöglicht, Daten in verschiedenen weltweit verteilten Google-Datenzentren zu speichern. Anwendungen, die auf diese Daten zurückgreifen, müssen auf diese Weise nicht mit langen Latenzzeiten kämpfen. Dafür hat Google ein globales Replizierungssystem geschaffen.

Eine Beispielanwendung, die diese Technologie nutzt, ist F1. Diese Lösung bildet das Backend für Googles Werbeplattformen. Die Anwendung spezifiziert dabei, welche Datenzentren, welche Informationen bekommen. Häufig genutzte Informationen werden dann in einem Datenzentrum nahe dem Nutzer gespeichert, um somit längere Abrufzeiten zu verhindern. In dieser Anwendung lässt sich zudem festlegen, wie viele Redundanzen in einem Google-Datenzentrum vorgehalten werden sollen.

In der Regel, so Google, werde eine Anwendung Daten in bis zu fünf Datenzentren in einer Region verteilen, eben um zu hohe Latenzen zu vermeiden. Ein spezielles System legt auch präzise Zeitpunkte fest, in denen Anwendungen Daten fehlerfrei schreiben, lesen oder replizieren können.

Die TrueTime-Programmierschnittstelle setzt allerdings neben GPS auch Atomuhren voraus, die in den Google-Datenzentren installiert werden müssen. Denn nur lässt sich die exakte Zeit festlegen, in der Daten geschrieben werden, ohne dabei eine globale Synchronisation durchführen zu müssen. Damit kann Google auf ein eigenes Protokoll für die Synchronisierung verzichten.

Die Öffentlichkeit erfuhr zum ersten Mal im Jahr 2009 von Spanner. Und Spanner wird jetzt zum Nachfolger von Megastore, auf dem Dienste wie Picasa, Gmail oder Google Calendar basieren. Und die neue Version übertrifft die Leistungs des Vorgängers bei weitem, wie Google mitteilt. Derzeit allerdings liegt Spanners Stäre im Lesen und weniger im Schreiben. Daher sind auch Anwendungen, die wenig Daten schreiben für diese Lösung noch besser geeignet. Web-Anwendungen, die hauptsächlich lesen etwa zählen dazu. Die F1-Plattform etwa zählt dazu. Weitere Anwendungen sollen folgen.

Neben den Schreib-Schwierigkeiten ist es auch der hohe Aufwand, eine Atom-Uhr und ein GPS-System mit dem Rechenzentrum zu verbinden, die einer hohen Verbreitung der neuen Technologie entgegenstehen. Dennoch hofft Google, dass sich um das Thema Echtzeitdatenbank herum eine lebendige Community entwickelt.

[mit Material von Jack Clark, ZDNet.com]