NoSQL: Die schlanke Zukunft dicker Datenbanken

CloudEnterpriseManagementNetzwerkeServer

Schon mal von CouchDB oder MongoDB gehört? Wir stellen ihnen die jungen Vertreter einer neuen Generation von Datenbanken vor, die einfach nicht mehr relational sein wollen.

Der Web-Dienst Ebay speichert 2 Petabyte. Wenn Facebook die Inboxen durchstöbert, müssen mal eben 50 Terabyte untersucht werden. Diese Beispiele sind Anwendungsgebiete für Datenbank-Technologien, die sich unter dem losen Sammelbegriff NoSQL subsummieren lassen.

NoSQL steht für ‘Not only SQL’, die Nähe zum ‘No’, ist aber ebenfalls nicht unerwünscht. Andere schlagen vor, diese Technologieansätze ‘Postrelational’ zu nennen. Die grundsätzliche Idee der Objekt-orientierten Datenbank lässt sich bis in die 80er-Jahre des vergangenen Jahrhunderts zurückverfolgen. Der Begriff NoSQL aber ist erst wenige Monate alt und geht auf den Rackspace-Mitarbeiter Eric Evans zurück.

Wie auch immer, die Datenbankwelt hat einen neuen Trend. Das Ende von relationalen Datenbanken auszurufen wäre verfehlt. Denn SQL lässt sich so schnell nicht ablösen. Aber Entwickler bekommen neue, ergänzende Werkzeuge an die Hand.

Und diese Werkzeuge sind zum Beispiel die auf Business-Intelligence getrimmten Technologien Aster Data, Greenplum, Neteeza oder Vertica. Von Google stammt BigTable und Amazon hat Dynamo.

Auch Open-Source-Projekte haben sich bereits um dieses Thema herum gebildet: Cassandra von Facebook, Apache HBase, CouchDB, Hadoop, Memcached, Tokyo Cabinet, MongoDB und LinkedIn hostet das Projekt Voldemort.

Keine dieser Technologien kann alles, aber dafür manches sehr gut. Zum Beispiel lassen sich die oben genannten Datenbanken sehr stark horizontal skalieren. Damit sind sie für den Einsatz in Cloud-Computing-Projekten prädestiniert. Gleichzeitig schaffen es diese Technologien auch, die Vorteile von mehrkernigen CPUs besonders gut auszunutzen.

Der einfache Aufbau dieser Datenbanken erleichtert das Entwickeln und Einbinden der Datenbanken. Weil die Daten nicht normalisiert werden, sind diese Datenbanken auch häufig schneller als ihre relationalen Verwandten.

Anklicken um die Biografie des Autors zu lesen  Anklicken um die Biografie des Autors zu verbergen