Oliver Schröder

ist Geschäftsführer EMEA Central bei Informatica.

Big DataData & Storage

Big Data Governance – vier Schritte zur Skalierung eines Enterprise Data-Governance-Programms

Bei vielen Unternehmen wächst die Einsicht, dass strukturierter Umgang mit und Überblick über die eigenen Datenbestände letztlich unumgänglich sind. Vor allem im Hinblick auf Big Data-Projekte müssen Daten gepflegt sein, um auch wahre Datenfluten bewältigen zu können. Eine ganzheitliche Strategie ist daher gefragt, damit Big Data-Initiativen von Erfolg gekrönt sind.

Grundlage dafür ist eine fundierte Data-Governance-Strategie. Bislang getrennt arbeitende Abteilungen müssen kooperieren, bestehende Datensilos aufgebrochen und die unterschiedlichen Anwendungen und Systeme miteinander verknüpft werden. Data Governance ist mehr als nur die Frage nach der Einhaltung von Datenschutzrichtlinien. Sie betrifft auch die Unternehmensstrukturen, durch klar definierte Prozesse mit Dateninhabern, Richtlinien, Regeln und Kriterien für den gesamten Lebenszyklus der Daten. Das Analystenhaus BARC hat weltweit 378 Unternehmen in seiner Studie How to Rule Your Business World zum Thema Data Governance befragt.

Die Ergebnisse lassen aufhorchen: 96 Prozent der befragten Unternehmen halten Data Governance bereits jetzt für einen unverzichtbaren Ansatz – und dieser wird auch zukünftig eine zentrale Rolle im Unternehmen spielen. Der Erfolg solcher Programme hängt stark von den verfügbaren und eingesetzten Ressourcen ab, so eine der zentralen Erkenntnisse der Studie. Die Herausforderung für Unternehmen besteht darin, zentrale Problemstellungen zu lösen, bevor ein Data- Governance-Programm implementiert wird. Dies spart nicht nur Zeit und Kosten, sondern es setzt auch Synergieeffekte frei. Doch was bedeutet dies in der Praxis? Vier Schritte helfen dabei, die Herausforderungen bei der Umsetzung eines Data-Governance-Programms zu bewältigen:

1. Datenmanagement: Datenbankverwaltung und -Katalogisierung

Jede Data-Governance-Initiative hängt vom transparenten Umgang mit Daten ab. Unternehmen und insbesondere Datenschutzbeauftragte müssen wissen, wo sich ihre Daten befinden, woher sie kommen, wie sie gespeichert und letztlich verwendet werden. Die Transparenz der Daten kann eine große Herausforderung sein, wenn es an die Skalierung eines Data-Governance-Programms geht. Generell gilt: Je mehr Daten ein Unternehmen verwaltet, desto schwieriger ist es, sie transparent nachzuverfolgen. Die richtige Katalogisierung von Daten ist daher entscheidend. Effektive Datenkataloge basieren auf gut gepflegten Metadaten. Unternehmen müssen in der Lage sein, ihre Metadaten zu identifizieren und mit andern Datensätzen in Relation zu setzen. Dies ermöglicht detaillierte Einblicke in Prozesse und den gesamten Lebenszyklus der Unternehmensdaten.

Sind mehrere Legacy-Systeme im Einsatz, ist die Verwaltung, Speicherung und das Management von Daten deutlich komplexer. Dies kann deren Katalogisierung in einen langen und kostspieligen Prozess verwandeln. Daher ist es enorm wichtig, zu Beginn alle Systeme zu überprüfen und die Daten aus den unterschiedlichen Applikationen zusammenzuführen, zu strukturieren und zu säubern. Nur dann ist eine korrekte Skalierung des Datenmanagements möglich. Obwohl Datenmanagement, Machine Learning und der Einsatz von KI eine zentrale Rolle spielen, ist die eingesetzte Technologie nicht der limitierende Faktor, der Data-Governance-Programmen die Grenzen bei der Implementierung aufzeigt. Die Hemmnisse liegen nach Erkenntnissen der BARC-Studie zumeist in einer fehlenden Gesamtstrategie, dem zu knapp kalkulierten Einsatz von Ressourcen, mangelnden übergreifenden Zusammenarbeit, oder aber einer übermäßigen Fokussierung auf administrative Aufgaben, Rollen und Prozesse.

2. Übergreifende Zusammenarbeit

Ein erfolgreich implementiertes Data-Governance-Programm ist vergleichbar mit einer Mannschaftssportart – beides basiert auf dem Prinzip einer reibungslosen Zusammenarbeit. Vor allem zwischen unterschiedlichen Abteilungen ist dies wichtig. Gerade, je umfangreicher das geplante Data-Governace-Programm ist. Bei der Umsetzung sind auch Abteilungen involviert, bei denen selbst das IT-Team keinen detaillierten Einblick in die entsprechenden Prozesse hat.

Dies erschwert es, Richtlinien zu entwickeln, die für das gesamte Unternehmen gelten. Daher sollten auf jeden Fall auch die Business User in die Implementierung mit einbezogen werden. Sie müssen ihre Erfahrungen über Prozesse und Abläufe einbringen. Es lohnt sich beispielsweise, ein Collaboration-Tool zu nutzen, das Workflows, Richtlinien, Definitionen und Regeln zusammenführt. Auf diese Weise lassen sich die Auswirkungen von Entscheidungen innerhalb des Programms sichtbar machen. Dieses Teamwork trägt auch dazu bei, den Erfolg des Data-Governance-Programms zu sichern.

3. Agile IT – dank flexibler Datenverwaltung

Unabhängig davon, wie umfangreich ein Data-Governance-Programm ist, sollte stets eine gewisse Agilität gewährleistet sein. Ist das Programm nicht flexibel skalierbar und lässt sich dementsprechend schnell anpassen, verlieren Unternehmen nicht nur an Dynamik, sondern dies kann auch zu einem schwer kalkulierbaren Risiko werden. Eine weitere Herausforderung besteht darin, die große Anzahl beteiligter Personen innerhalb des Data-Governance-Programms in Einklang zu bringen.

Die Lösung ist ein effizientes Entscheidungsgremium, das alle Beteiligten berücksichtigt und zeitnahe Entscheidungen treffen kann. Ein Best-Practice-Entscheidungsrahmen, beispielsweise ein DACI-Ansatz (Driver, Approver, Contributor und Informed), kann die richtige Entscheidung sein. Diese Rahmenbedingungen schaffen einen kontinuierlichen Zyklus des Zuhörens, Handelns und Evaluierens. Jeder Mitarbeiter ist damit in der Lage, aktiv an der Diskussion teilzunehmen. Eine kleine Gruppe, in Form eines Data-Governance-Rates, behält hierbei letztlich die Entscheidungs- und Umsetzungskontrolle.

4. Automatisiertes Datenmanagement – dank künstlicher Intelligenz

Das kontinuierlich wachsende Datenvolumen ist eine weitere Herausforderung bei der Skalierung eines Data-Governance-Programms. Machine Learning (ML) kann dabei helfen, viele Funktionalitäten zu automatisieren. Datensätze können mittels Automatisierung und ML mit weiteren Daten angereichert, strukturiert, integriert und in verschiedenste Kontexte gesetzt werden. Auch repetitive Geschäftsprozesse können automatisch mit physischen Daten verknüpft werden. All diese Funktionen mögen einzeln genommen relativ unbedeutend erscheinen, insgesamt lassen sich Zeit und Ressourcen signifikant reduzieren – insbesondere, wenn es um die Verarbeitung von Hunderten von Millionen von Datensätzen geht.

Knapp 50 Prozent der von BARC befragten Unternehmen sagen, dass die momentan größte Herausforderung im Bereich der Datenqualität und beim richtigen Umgang mit fehlerhaften oder unvollständigen Datensätzen liegt. Während überraschenderweise die Hemmnisse durch Datensilos und Problemstellungen des generellen Auffindens von Datensätzen nur von 34 Prozent der befragten Unternehmen als zu bewältigende Herausforderung bewertet werden.

Big Data Governance – erfolgreich umgesetzt

Keine Frage, die Skalierung eines maßgeschneiderten Data-Governance-Programms ist schwierig. Geht es jedoch um Big Data und damit verbundene Projekte, ist dies unabdingbar. Allerdings lassen sich zumindest die zeitaufwändigen manuellen Aufgaben relativ problemlos automatisieren. Dies erleichtert unter anderem die Nachverfolgung von Daten im Unternehmen erheblich. Die Vorteile der Implementierung eines unternehmensweiten Data-Governance-Programms gehen weit über die Durchführung von Analyseprojekten hinaus.

So antworten 64 Prozent der von BARC befragten europäischen Unternehmen, dass die Einhaltung gesetzlicher Bestimmungen zusammen mit einem effizienteren Umgang mit Daten (54 Prozent) sowie der wachsenden Anzahl an geschäftsrelevanten internen und externen Daten (54 Prozent) die treibenden Faktoren für Data-Governance-Programme in Unternehmen sind. Von den weltweit insgesamt 378 von BARC befragten Unternehmen gaben 24 Prozent an, dass ein Data-Governance-Programm bereits implementiert wurde, während 32 Prozent der Unternehmen momentan eine entsprechende Lösung implementieren.

18 Prozent der Unternehmen befinden sich noch in der Planungsphase, auch wenn diese Pläne bereits recht konkret sind. Weitere 23 Prozent der Unternehmen gehen davon aus, dass in naher Zukunft ein Data-Governance-Programm eingeführt wird. Diese Zahlen verdeutlichen auf eindrucksvolle Weise die Dringlichkeit, die Organisationen unter zunehmen Handlungsdruck setzten, das Thema Data Governance pro-aktiv anzugehen. Vollständige Transparenz und Kontrolle über Datenbestände – wie sie verwendet werden, wer sie verwendet und wo sie gespeichert sind – ist von unschätzbarem Wert. So lässt sich der Datenschutz verbessern und die digitale Transformation beschleunigen.

Darüber hinaus ist es möglich, bislang getrennte Abteilungen zusammenzuführen. Keine Frage, die Skalierung eines maßgeschneiderten Data-Governance-Programms ist komplex. Geht es jedoch um Big Data und damit verbundene Projekte, so ist dies auch notwendig. Zeitaufwändige manuelle bzw. repetitive Aufgaben sind so problemlos automatisierbar. Innovationen im Metadatenmanagement erlauben Unternehmen, aus den gespeicherten Daten einen Mehrwert zu ziehen und damit bessere Geschäftsentscheidungen zu treffen.