Appliances drängen ins Data Warehouse

Mehrere amerikanische Start-ups bringen frischen Wind in den Markt für Data Warehousing. Mit dedizierten Komplettsystemen und einem äußerst aggressiven Pricing wolle sie Teradata und Co das Fürchten lehren.

Data Warehouse Appliance (DWA) nennt Netezza, das als Erfinder des Begriffs gilt, seine Systeme, die den etablierten Data-Warehouse-Anbietern das Fürchten lehren sollen. Das US-Unternehmen hat ein System aus einem Guss entwickelt, das Commodity-Komponenten wie Intel-Prozessoren, Linux und eine Open-Source-Datenbank nutzt. Das Angebot stößt vor allem bei Unternehmen auf Interesse, die ihre riesigen Datenmengen bislang nicht oder nur unzureichend analysieren konnten – Datenmengen im Terabyte-Bereich.

Hardwareseitig handelt es sich um eine Mischung aus symmetrischem und massiv-parallelem Multiprocessing. Zusätzliche Prozessoren und Logikbausteine auf Disk-Level reduzieren die I/O-Ströme und erhöhen die Performance. Das System unterstützt Standard-Datenbankschnittstellen wie SQL, ODBC und JDBC und ist mit vielen Business-Intelligence-Tools von Drittanbietern kompatibel. Diese Leistung bietet Netezza zu einem vergleichsweiße geringen Preis an: Der Einstieg für ein System mit bis zu einem Terabyte Daten gelingt mit 300.000 Dollar.

Mit Data Warehouse Appliances wollen Anbieter wie Netezza keine installierten Data Warehouses ersetzen, sondern diese dort ergänzen, wo die Installationen etablierter Anbieter gewisse Analysen nicht ermöglichen. Dazu werden die benötigten Daten aus dem zentralen Data Warehouse in eine DWA geschaufelt, die dann die Rolle eines Data Mart übernimmt.

Auf der Hype-Kurve

Stolz verweist Netezza darauf, dass das Beratungsunternehmen Gartner in seinem ‘Hype Cycle’ des Jahres 2005 zur Bewertung neuer Technologien noch fünf bis zehn Jahre prognostiziert habe, bevor DWAs echte Produktivität erreichten; 2006 – nur ein Jahr danach – sei Gartner nur noch von zwei bis fünf Jahren ausgegangen, bis DWAs zum Mainstream werden.

Die Idee der Data Warehouse Appliance ist nicht neu. Teradata beispielsweise macht es im Prinzip schon lange so – und zwar deutlich proprietärer als die DWA-Anbieter, findet Philip Howard, Analyst bei Bloor Research: Teradata nutze eine proprietäre Datenbank, einen proprietären Interconnect und ein fast proprietäres Betriebssystem in einer Umgebung, die mehr oder weniger vollständig proprietär sei. So erreichen Teradatas Data Warehouses hohe Leistungswerte und – so das Argument des Anbieters – sind dadurch letztlich preiswerter bei großen Datenmengen als die der Konkurrenz von Oracle oder IBM. DWA-Anbieter wie Netezza wiederum können solche Speziallösungen dank Commodity-Komponenten mit sehr aggressiven Preisen anbieten.