Harald Weimer

ist Geschäftsführer von Talend Deutschland und Vice President Sales Central Europe. Er hat über 25 Jahre Erfahrung im Vertrieb von Softwarelösungen und war unter anderem bei der USU AG und Iona Technologies tätig.

Lektionen für Data Warehousing von einem Scrabble-Genie

Lektionen zu Data-Warehousing und Cloud-Data-Integration können von ganz unerwarteter Seite kommen. Unglaublich findet es Harald Weimer von Talend, dass der Gewinner der Scrabble-Meisterschaften 2015 in französischer Sprache kein Französisch spricht!

Der Neuseeländer Nigel Richards hat 2015 die internationale Scrabble-Weltmeisterschaft, die French World Scrabble® Championship, gewonnen, ohne auch nur ein Wort dieser Sprache zu sprechen. Zudem setzte er viele ungewohnte Wörter ein, die der durchschnittliche Franzose noch nicht einmal kennt. Das Geheimnis dieses Erfolgs liegt in zweierlei: der Fähigkeit sich alle 368.000 Wörter der offiziell genehmigten französischen Liste, die Officiel du Scrabble (ODS) zu merken, und der Fähigkeit, auf dem Brett die besten Platzierungsstrategien anzuwenden.

Überraschend genug bietet dieses außergewöhnliche Ereignis gleiche mehrere Lehren für alle, die ein datenbestimmtes Unternehmen werden und der Konkurrenz voraus sein möchten.

Es geht um konsistente, vertrauenswürdige Daten

Nigel Richard hat sein Gehirn quasi in ein Data Warehouse umgewandelt. Dieses enthielt alle genehmigten Wörter, eine “Single Version of Truth” oder alleinige Quelle der Wahrheit, auf deren Grundlage er gespielt hat. Dies ist keine kleine Leistung: die üblichen Mnemotechniken wie der Gedächtnispalast können bei einer Aufgabe, bei der die Wörter für den Gehirnakrobaten selber keine Bedeutung haben, nicht angewandt werden.

(Bild: Shutterstock.com)

Moderne Unternehmen stehen vor ähnlichen Herausforderungen. Um ein wirklich datenbestimmtes Unternehmen werden zu können, müssen sie über eine solide Strategie und Infrastruktur für das Datenmanagement verfügen, so dass ihre Daten vertrauenswürdig und die daraus resultierenden Aktionen effektiv sind. Dies bedeutet, dass Daten aus mehreren Quellen gezogen werden müssen (zum Beispiel Salesforce, Marketo, Netsuite, SAP, Excel und verschiedenen Datenbanken). Dann müssen die entsprechenden Schritte durchgeführt werden, die für Konsolidierung, Säuberung, Umwandlung und das Laden der Daten in ein Data Warehouse notwendig sind. Aber anders als beim ODS sind diese Daten keine starre, unveränderbare Liste. Im Gegenteil: sie müssen ständig aktualisiert und abgeglichen werden.

Daten optimal nutzen

Die nächste Lehre ist, dass Sie sich auf die wichtigsten übergeordneten Muster und Metriken konzentrieren müssen, damit Sie handlungsfähig werden. Nigel Richards musste die Wörter nicht verstehen, um seine Plättchen zu setzen. Er analysierte die Anzahl Punkte, die jedes Wort bringen würde, wie dieses Wort seine späteren Spielzüge unterstützen und wie es die Spielmöglichkeiten des Gegners einschränken würde. Dabei hat er seine Spielerfahrung oder Best Practices eingesetzt, die er schon bei Scrabble-Meisterschaften in anderen Sprachen gewonnen hatte. Die Wörter unterscheiden sich zwar, aber die Muster, die er auswählt, sind die gleichen.

Bevor Sie Ihre analytischen Kenntnisse und Unternehmenseinblicke einbringen können, beispielsweise für das Einpflegen aller Daten in AWS Redshift und die anschließende Verwendung von Tableau Software oder QlikView oder für den direkten Import aller Daten in Salesforce Analytics Cloud, muss die Grundlage wie ein Fels stehen. Dies bringt uns zurück zur Datenintegration.

Was dies für Sie bedeutet

Richards hat ganz allein fast 400.000 Wörter in nur neun Wochen ‘importiert’. Viele Manager wären höchst zufrieden, einen solchen Zeitplan in Ihren Projekten umsetzen zu können!

Glücklicherweise bieten die Lösungen zur Cloud-Data-Integration eine neue, flexible Herangehensweise, mit der Organisationen ihre Anwendungen und Datenquellen schnell integrieren können, ohne dass sie sich über die Bereitstellung der Hardware oder die Administration der Plattform Gedanken machten müssten. Die besten Tools bieten einsatzfertige Connectors für das Extrahieren und Laden der Daten ohne manuelle Codierung, sowie Komponenten für das Entduplizieren, Validieren, Standardisieren und Aufbereiten der Daten zur Erreichung einer höheren Datenqualität. Wenn Sie an einer solchen Lösung interessiert sind, dann empfehle ich Ihnen Talend Integration Cloud.