Lektionen für Data Warehousing von einem Scrabble-Genie

Der Neuseeländer Nigel Richards hat 2015 die internationale Scrabble-Weltmeisterschaft, die French World Scrabble® Championship, gewonnen, ohne auch nur ein Wort dieser Sprache zu sprechen. Zudem setzte er viele ungewohnte Wörter ein, die der durchschnittliche Franzose noch nicht einmal kennt. Das Geheimnis dieses Erfolgs liegt in zweierlei: der Fähigkeit sich alle 368.000 Wörter der offiziell genehmigten französischen Liste, die Officiel du Scrabble (ODS) zu merken, und der Fähigkeit, auf dem Brett die besten Platzierungsstrategien anzuwenden.

Überraschend genug bietet dieses außergewöhnliche Ereignis gleiche mehrere Lehren für alle, die ein datenbestimmtes Unternehmen werden und der Konkurrenz voraus sein möchten.

Es geht um konsistente, vertrauenswürdige Daten

Nigel Richard hat sein Gehirn quasi in ein Data Warehouse umgewandelt. Dieses enthielt alle genehmigten Wörter, eine “Single Version of Truth” oder alleinige Quelle der Wahrheit, auf deren Grundlage er gespielt hat. Dies ist keine kleine Leistung: die üblichen Mnemotechniken wie der Gedächtnispalast können bei einer Aufgabe, bei der die Wörter für den Gehirnakrobaten selber keine Bedeutung haben, nicht angewandt werden.

Moderne Unternehmen stehen vor ähnlichen Herausforderungen. Um ein wirklich datenbestimmtes Unternehmen werden zu können, müssen sie über eine solide Strategie und Infrastruktur für das Datenmanagement verfügen, so dass ihre Daten vertrauenswürdig und die daraus resultierenden Aktionen effektiv sind. Dies bedeutet, dass Daten aus mehreren Quellen gezogen werden müssen (zum Beispiel Salesforce, Marketo, Netsuite, SAP, Excel und verschiedenen Datenbanken). Dann müssen die entsprechenden Schritte durchgeführt werden, die für Konsolidierung, Säuberung, Umwandlung und das Laden der Daten in ein Data Warehouse notwendig sind. Aber anders als beim ODS sind diese Daten keine starre, unveränderbare Liste. Im Gegenteil: sie müssen ständig aktualisiert und abgeglichen werden.

Daten optimal nutzen

Die nächste Lehre ist, dass Sie sich auf die wichtigsten übergeordneten Muster und Metriken konzentrieren müssen, damit Sie handlungsfähig werden. Nigel Richards musste die Wörter nicht verstehen, um seine Plättchen zu setzen. Er analysierte die Anzahl Punkte, die jedes Wort bringen würde, wie dieses Wort seine späteren Spielzüge unterstützen und wie es die Spielmöglichkeiten des Gegners einschränken würde. Dabei hat er seine Spielerfahrung oder Best Practices eingesetzt, die er schon bei Scrabble-Meisterschaften in anderen Sprachen gewonnen hatte. Die Wörter unterscheiden sich zwar, aber die Muster, die er auswählt, sind die gleichen.

Bevor Sie Ihre analytischen Kenntnisse und Unternehmenseinblicke einbringen können, beispielsweise für das Einpflegen aller Daten in AWS Redshift und die anschließende Verwendung von Tableau Software oder QlikView oder für den direkten Import aller Daten in Salesforce Analytics Cloud, muss die Grundlage wie ein Fels stehen. Dies bringt uns zurück zur Datenintegration.

Was dies für Sie bedeutet

Richards hat ganz allein fast 400.000 Wörter in nur neun Wochen ‘importiert’. Viele Manager wären höchst zufrieden, einen solchen Zeitplan in Ihren Projekten umsetzen zu können!

Glücklicherweise bieten die Lösungen zur Cloud-Data-Integration eine neue, flexible Herangehensweise, mit der Organisationen ihre Anwendungen und Datenquellen schnell integrieren können, ohne dass sie sich über die Bereitstellung der Hardware oder die Administration der Plattform Gedanken machten müssten. Die besten Tools bieten einsatzfertige Connectors für das Extrahieren und Laden der Daten ohne manuelle Codierung, sowie Komponenten für das Entduplizieren, Validieren, Standardisieren und Aufbereiten der Daten zur Erreichung einer höheren Datenqualität. Wenn Sie an einer solchen Lösung interessiert sind, dann empfehle ich Ihnen Talend Integration Cloud.

Martin Schindler

Martin Schindler schreibt nicht nur über die SAPs und IBMs dieser Welt, sondern hat auch eine Schwäche für ungewöhnliche und unterhaltsame Themen aus der Welt der IT.

Recent Posts

Cloud-Beschleuniger Covid

Vielfach hat die Coronapandemie bestehende IT-Strukturen aufgebrochen oder gar über den Haufen geworfen – gefühlt.…

8 Monate ago

Trends 2021 – Vier Entwicklungen bei (Graph)Datenbanken und Datenanalyse

Das Covid-Jahr 2020 konnte die digitale Transformation nicht ausbremsen. Sogar ganz im Gegenteil: Viele Unternehmen…

10 Monate ago

Ein globales digitales Identitätssystem muss Vertrauen und Transparenz schaffen

Nach Angaben der Weltbank fehlt mehr als einer Milliarde Menschen ein offizieller Identitätsnachweis. Ohne den…

10 Monate ago

Nachhaltigkeit wird zu einem der Schlüsselkriterien in der Tech-Industrie

Das Thema Nachhaltigkeit ist seit vielen Jahren fester Bestandteil des Selbstverständnisses vieler Unternehmen. Wenig verwunderlich,…

10 Monate ago

Chief Data Officer: Garanten für eine stärkere Datennutzung in Unternehmen

Unternehmen sammeln eine Vielzahl von Daten. Doch IDC Analysten fanden in ihrer aktuellen Studie „IDC‘s…

10 Monate ago

Ethik, Regulierungen, Cloud: Der Nebel lichtet sich

COVID-19 hat 2020 sowohl Gesellschaft als auch Wirtschaft bestimmt. Unbestritten ist auch die katalytische Wirkung,…

11 Monate ago