“Daten sind das neue Öl”

Big DataData & StorageDatenbankEnterpriseManagementSoftware

“Das ist hier ein Event für Daten-Junkies”, sagt Teradata-Europachef Hermann Wimmer über die eigene Hauskonferenz Universe. Davon gibt es immer mehr. Denn inzwischen sprudeln Business-relevante Daten nahezu ungebremst aus Quellen, die vor Kurzem kaum noch jemand beachtet hat.

Der virtuose Umgang mit großen Datenmengen ist längst nicht mehr das Spezialfeld eines exklusiven Data-Warehouse-Zirkels. Das macht auch der Auftritt von David McCandless deutlich, der als “Data Journalist” bekannt geworden ist. Mit einer ebenso bunten wie überraschenden Präsentation sorgt er dafür, dass hunderte Zuschauer gebannt einer Aufzählung von Zahlen folgten, die eigentlich wie Schlafmittel wirken: Quartals-, Umsatz-, Haushaltszahlen.

Sein “Billion Dollar-O-Gram” vergleicht unter anderem die Ausgaben für den Irak-Krieg mit dem Budget der UN und visualisiert diese Informationen in einprägsamen Infographiken. Kern seiner Arbeit sei, die wesentlichen Daten herauszufiltern anstatt so viele Informationen wie möglich in eine Grafik zu packen.

Dollar-o-Gram
Bunte Datenanalyse: Das Billion Dollar-O-Gram.
Foto: informationisbeaufiful.net

Es gebe einen großen Unterschied zwischen vereinfachter und optimierter Information, sagt McCandless. Er selbst versuche Informationen zu optimieren und so viele überflüssige Details wie möglich wegzulassen.

Diese Unterscheidung zwischen notwendigen und überflüssigen Daten ist eine der großen Herausforderungen der Data-Warehousing-Zunft der Zukunft. Die neu vorgestellte Teradata-Appliance Active EDW 6680 sortiert automatisiert nach “heißen” und “kalten” Daten, also solchen auf die ein Unternehmen häufig beziehungsweise selten zugreift.

Das heißt aber auch: Zunächst sind alle Daten “heiß”, erst nach einer gewissen Zeit kann anhand der Zugriffsmuster entschieden werden, welche Daten wo richtig aufgehoben sind. Künftig soll es nach den Worten von Chief Development Officer Scott Gnau möglich sein, dass die Appliance schon im Moment des Speicherns weiß, welche Daten für das Unternehmen heiß und kalt sein werden.

“Die Zugriffs-Pattern entsprechen einer gewissen Logik”, erläutert Hermann Wöstefeld, Director Architecture Consulting, im Gespräch mit silicon.de. “Wenn beispielsweise auf neue Kundentabellen innerhalb der ersten drei Monate besonders häufig und danach immer seltener zugegriffen wird, kann man daraus eine Regel ableiten. Vergleichbar mit einem lernenden System.” Insofern sei es durchaus vorstellbar, dass in künftigen Releases entsprechende Algorithmen eingeführt würden.

Roundtable
Teradata-CEO Mike Koehler und Europachef Hermann Wimmer im Gespräch mit silcon.de
Foto: silicon.de

Die Unternehmen werden solche Unterstützung dringend nötig haben. Als neue Treiber und potentielle Großkunden der Data-Warehouse-Szene gelten inzwischen verstärkt das Gesundheitswesen und Smart Grids. “Wenn jeder Haushalt ein Smart Meter hätte, gäbe es nicht genügend Festplatten auf der Welt, um diese Daten zu speichern”, sagt SAS-CEO Jim Goodnight.

In den USA hat jüngst der Energieversorger Souther California Edison (SCE) sein Engagement in diese Richtung verstärkt. Im Rahmen des Projekts “SmartConnect” werden in mehreren Städten herkömmliche Stromzähler durch digitale Zwei-Wege-Geräte ersetzt. “Das ist einer der entscheidenden Schritte auf einem Weg zu einem Smart Grid”, sagt David W. Erickson, Director Information Technology Edison SmartConnect, gegenüber silicon.de. Doch der Weg dorthin ist, nicht nur in Deutschland, noch lang, unter anderem fehlt es an internationalen Standards.

Was in der Gesundheitsbranche mit verstärkter Datenanalyse machbar ist, beschreibt Hermann Wimmer anhand des US-Krankenversicherers Wellpoint. Dieser nutzt die gesammelten Daten der Versicherten seit kurzem nicht mehr nur für die eigene Forschung, sondern stellt die Erkenntnisse auch Krankenhäusern zu Verfügung, um so die Versorgung der Patienten zu verbessern.

“Firmen, denen es nicht gelingt, ihre Daten intelligent zu integrieren und auszuwerten, werden in Zukunft auf der Verliererseite stehen. Davon bin ich überzeugt”, sagt Wimmer. Data Journalist David McCandless formuliert es knapper: “Daten sind das neue Öl.” Laut IBM haben inzwischen 83 Prozent der CIOs das Thema Business Analytics ganz oben auf ihrer To-Do-Liste. Daten-Junkies gibt es inzwischen überall.