Chris Hackett

ist Vice President Northern Europe bei Talend und Experte für IT-Integration und Enterprise-Open-Source.

Big DataEnterprise

Hitchhiker´s Guide to Big Data – was bringt eine Antwort, wenn man die Frage nicht kennt?

Towel-Day bei silicon.de: Der Enterprise-Open-Source- und Datenintegrations-Experte Chris Hackett ist der jüngste Neuzugang im silicon.de-Blog-Netzwerk. Er nähert sich dem Thema Big Data mit Hilfe seines britischen Landsmannes Douglas Adams, der das Szenario, dass man zwar die Antwort kennt, aber die Frage nicht mehr weiß, schon einmal literarisch durchgespielt hat.

Big Data liefert uns Antworten. Aber taugen die Antworten etwas und wie lange benötigen die zur Verfügung stehenden Rechner, um sie auszuwerfen? Und wie war doch gleich die Frage? Der Schriftsteller Douglas Adams hat diese Probleme bereits Ende der Siebziger Jahre in seinem Bestseller “Per Anhalter durch die Galaxis” (auf Englisch: “Hitchhiker´s Guide to the Galaxy”) thematisiert. Mit seinem ganz speziellen Humor: Dem allwissenden Computer “Deep Thought” wird die Frage nach “dem Leben, dem Universum und dem ganzen Rest” gestellt. Daran hat sogar ein Supercomputer zu knacken. Nach siebeneinhalb Millionen Jahren Rechenzeit hat er die Antwort (“Sie wird euch nicht gefallen…”). Natürlich sind die ursprünglichen Fragesteller längst nicht mehr, aber eine Delegation wartet. Und die Antwort lautet… Nein, fangen wir noch einmal von vorne an.

Per Anhalter durch das Big-Data-Universum

Stellen Sie sich vor, feindliche Vogonen wollen die Erde für eine interstellare Umgehungsstraße sprengen. Und Sie schaffen es mit Hilfe eines freundlichen außerirdischen Anhalters gerade noch rechtzeitig als blinde Passagiere auf das Vogonen-Schiff, bevor alles in die Luft fliegt. Von dem Punkt an reisen Sie per Anhalter durch die Galaxis, im Gepäck der gleichnamige Reiseführer, der wirklich für jede Situation einen Ausweg weiß. Douglas Adams soll auf diese absurde Story gekommen sein, als er einmal betrunken bei Innsbruck in einem Acker lag, über sich den Sternenhimmel, neben sich den “Hitchhiker´s Guide to Europe”.

Was hat das Ganze mit Big Data zu tun? Auch Verantwortliche im Rechenzentrum fühlen sich beim Thema Big Data oft wie auf einem feindlichen Vogonen-Schiff, auf dem andere die Richtung vorgeben. Um zu wissen, wohin die Reise geht, sollte eine Strategie entworfen werden, die nicht nur Produkte beinhaltet, sondern auch konkrete Ziele vorgibt. Mitarbeiter wollen mitgenommen werden, auch das verbindet sie mit den Anhaltern in der Geschichte.

Die Reiseführerreihe “Hitchhiker´s Guide to…” gibt es wirklich und sie ist bzw. war sehr beliebt, weil sie eine andere Art des Reisens propagiert: Kostengünstig, flexibel, unangepasst, außerhalb des Mainstreams. So wie Open-Source in der IT-Welt. Wer per Anhalter an sein Ziel kommen will, benötigt außerdem Unterstützung anderer, also eine Art “Community” aus bereitwilligen Chauffeuren. Als Anhalter spart man sich Investitionen in einen eigenen fahrbaren Untersatz und kann die entsprechenden Mittel einsetzen, um seine Lebensqualität zu steigern, sich also auf das Wesentliche konzentrieren. Wer dabei nicht komplett vom Zufall oder dem “Goodwill” der Teilnehmer des fließenden Verkehrs abhängig sein will, kann auch eine Mitfahrzentrale nutzen – nicht ganz so flexibel, günstig und cool, aber immer noch eine Alternative.

Wie war doch gleich die Frage?

Der Hitchhiker´s Guide to Big Data fasst die Produkte und Ressourcen von Talend zusammen und gibt der IT-Abteilung ein Kompendium an die Hand, das auf alle Fragen rund um Big Data eine Antwort weiß. Für viele Firmen ist Big Data immer noch Neuland, etwa so weit von der eigenen IT entfernt wie das Zuhause der Vogonen. Wer sich auf das Abenteuer Big Data einlässt, steht vor großen Herausforderungen und ist nur einen Schritt davon entfernt, die Organisation seines Unternehmens von Grund auf zu ändern. Informationen stammen heute nicht nur aus Datenbanken zu Kunden, Lieferanten oder Produkten: Geschäftsprozesse erzeugen kontinuierlich Daten, ebenso Sensoren in bspw. Smartphones, Smart Meters (Stromzählern) oder Fahrzeugen. Um aus all diesen Daten wertvolle Informationen entstehen zu lassen, wird auch kein Supercomputer vom Schlage eines Deep Thought benötigt.

Die wichtigste Software ist Open-Source (Hadoop) und läuft auf Standard-Hardware. Anbieter wie Talend machen Hadoop komfortabel bedienbar und ergänzen die Lösung um wichtige Funktionen, etwa bei der Integration unterschiedlichster Datenquellen. Und Antworten benötigen auch keine siebeneinhalb Millionen Jahre – in der heutigen Geschäftswelt wäre das auch völlig inakzeptabel. Stichwort Deep Thought: Ich bin Ihnen noch die Antwort auf die Frage nach dem Leben, dem Universum und dem ganzen Rest schuldig: Sie lautet “42”.

Aus nachvollziehbaren Gründen war niemand mit der Antwort zufrieden und Deep Thought sah sich außerstande, die entsprechende Frage zur Antwort “42” zu liefern. Die sollte ein neuer, besserer Supercomputer liefern. Als ein entscheidender Teil dieses Supercomputers ist die Erde konstruiert worden, die aber dummerweise fünf Minuten vor Ablauf eines 10 Millionen Jahre dauernden Programms von den Vogonen zerstört wurde. Die Auftraggeber wollen daraufhin dem Protagonisten des Buches und letztem Erdling sein Gehirn abkaufen, weil sie hoffen, darin Hinweise auf die Frage zu finden. Was dieser entschieden ablehnt… Zum Glück laufen moderne Big-Data-Lösungen in ausfallsicheren Clustern, so dass der Ausfall eines Teils nicht die ganze Berechnung gefährdet. Aber auch in der Unternehmensrealität nimmt die Suche nach den entscheidenden Fragen mindestens ebenso viel Raum ein wie die Interpretation der Antworten. Ein ganz neuer Berufszweig widmet sich diesem Aspekt, so genannte Data-Scientists werden gerade zur neuen Programmierer-Avantgarde.

Immer ein Handtuch dabei haben

Die Vorstellung ist schön, aber leider gibt es den allumfassenden “Hitchhiker´s Guide to Big Data” noch nicht. Dafür gibt es Produkte, etwa von Talend, mit denen IT-ler und Unternehmen für die Reise ins Big-Data-Land gerüstet sind. Mein abschließender Rat: Behalten Sie ihr Gehirn, machen Sie das Beste aus der Antwort nach dem Leben, dem Universum und dem ganzen Rest, die Sie jetzt wissen (“42”). Und beherzigen Sie den wichtigsten Hitchhiker-Tipp überhaupt: Keine Panik und immer ein Handtuch dabei haben. Dann klappt es auch mit den Big Data.

  1. Na das ist ja ein Ding! Sie haben im selben Kontext Douglas Adams Kultroman genannt wie ich in diesem Jahr in meinem Autorenbeitrag für die FAZ. Ich bin geneigt zu glauben, das das kein Zufall sein kann….Nachlese unter der aufgeführten Website … schönen Tag noch.