Deutschland ist im Vergleich mit 22 anderen Ländern weltweit das Land mit dem höchsten Anteil an Dark Data, der Weltmeister bei Dark Data sozusagen. Das zeigt die Databerg Studie, in dessen Rahmen 200 deutsche IT Leiter befragt wurden. Sie sagten aus, dass im Schnitt 66 Prozent aller ihrer gespeicherten Daten zur Kategorie Dark Data gehören. Sie wissen also bei mehr als der Hälfte ihrer Daten nicht, um was für Daten es sich handelt.

Eine Ursache hierfür sind die hierzulande stark ausgeprägten Datenschutzrechte. Wer Daten klassifizieren und somit Licht in die dunklen unstrukturierten Datenberge werfen will, muss sorgfältig vorgehen, Betriebsräte mit einbeziehen und Prozesse, wie das Vieraugenprinzip, befolgen. Das ist aufwändig, bindet Ressourcen und Zeit und erklärt zum Teil, warum so ein großer Teil der Inhalte in den Daten im ungewissen bleibt. Die Studie zeigt aber auch: selbst in Ländern mit laxeren juristischen Vorgaben erreicht der Anteil von Dark Data mehr als 50 Prozent, das heißt, bei mehr als der Hälfte der Daten wissen Firmen nicht, was in ihnen steckt.

Eine Situation mit finanzieller Sprengkraft, denn am 14. April hat das Parlament der Europäischen Union die Reform des Rechtsrahmens zum Schutz personenbezogener Daten (European Data Protection Regulation (GDPR) verabschiedet. Dies ist eine EU-weite Richtlinie, die den Datenschutz in allen 28 Mitgliedsstaaten harmonisieren wird. Die neue Regelung stärkt die Rechte europäischer Bürger in Bezug auf persönliche Daten.

Der Bürger ist beispielsweise fristgerecht über Datenpannen zu informieren, wenn seine Daten betroffen sind. Er oder sie darf ein Löschen der persönlichen Daten einfordern, die übrigens nur noch zweckgebunden genutzt werden dürfen. Die Richtlinie GDPR tritt am 25. Mai 2018 in Kraft und damit auch mögliche Sanktionen. Wer grob gegen sie verstößt, muss im Ernstfall mit Bußgeldern in Höhe von zwei bis vier Prozent des Jahresumsatzes aus dem Vorjahr oder maximal 20 Millionen Euro rechnen. Wie können Unternehmen aber diesen Anforderungen gerecht werden, wenn wie in Deutschland 66 Prozent ihrer Daten Dark Data sind, ihr Inhalt also per Definition völlig unbekannt ist?

Ursachen und Folgen des Datenmülls

Die Daten werden heutzutage fragmentiert abgelegt. Das heißt in der Praxis, dass Daten zunehmend auf unterschiedliche Speicherorte gestreut abgelegt werden. Insbesondere die Mitarbeiter nutzen Cloud-Storage-Dienste, um darüber Daten auszutauschen. Die Databerg Studie zeigt, dass bei allen befragten Unternehmen solche Dienste per Policy erlaubt sind. Leider verwenden die User auch Dienste, die von der IT nicht erlaubt worden sind.

Alle Daten, die über solche Services verteilt werden, sind per Definition Dark Data, da die IT Abteilung keinen Einblick in diese Daten hat. Der Databerg mit dem hohen Anteil von Dark Data ist nicht nur ein Kostenpunkt – er steht auch für ein ernstzunehmendes Compliance-Risiko.

Die Studie ermittelte drei Hauptgründe für den Anstieg des Databergs. Sie hängen mit strategischen Fragen der IT genauso zusammen wie mit Hypes der Industrie und Mitarbeitern, die durch eigene Taten Firmendaten in Gefahr bringen. Zu den Gründen zählen:

  1. IT-Strategien, die rein auf mehr Speicherkapazität setzen, dafür den Wert der Daten ignorieren: Bisher hat die Strategie gefruchtet, jedes Jahr mehr Kapazität für das Speichern der Daten aufzubauen. Statt in strategisch wichtige Daten zu investieren, wird Infrastruktur für schlechte Daten gebraucht. Man wirft gutem Geld schlechtes hinterher. Das Wachstum der Daten hat aber so an Geschwindigkeit zugenommen, dass diese Strategie versagen wird.
  2. Das Grundvertrauen in kostenlosen Speicherplatz, besonders aus der Cloud: Das Versprechen von “kostenlosem, unbegrenztem Speicher aus der Cloud” – bei Sync & Share Diensten und anderen Cloud Storage Konzepten – ist verführerisch. Fakt ist, dass diese Angebote auf mittlere Sicht weder kostenlos noch unendlich verfügbar bleiben. Der Mythos des “kostenlosen Speichers” hat aber heute zur Folge, dass der Anteil von Dark Data weiterhin wächst und diese Daten aus der Sichtweite der Managementteams geraten. Dies schafft neue Compliance-Risiken.
  3. Mitarbeiter, die Datenrichtlinien ihrer Arbeitgeber immer öfter missachten: Die Databerg Studie hat gezeigt, dass die Zusammenführung von unternehmerischen und persönlichen Daten innerhalb des Firmennetzes den Berg geschäftlich irrelevanter Daten gefährlich wachsen lässt. Angestellten zu erlauben, Daten frei zu bewegen und auf externe Ressourcen zu exportieren, beschleunigt den Kontrollverlust über wichtige Informationen. Es ist daher wichtig, eine datenzentrische Kultur zu etablieren, die von oben nach unten vorgelebt wird. Einige erfolgreiche Organisationen haben etwa einen unternehmensweiten “Datensäuberungstag” eingeführt.

Was können Firmen tun?

Anfangs sollte die Dark Data untersucht und klassifiziert werden – mit Hilfe von Technologien, die in der Lage sind, Daten zu finden, ihre Inhalte zu identifizieren und festzustellen, wer Zugriff darauf hat. Dadurch können Unternehmen die ROT-Daten risikofrei löschen und Angestellte motivieren, die geschäftskritischen Daten proaktiv zu pflegen und zu verwalten.

Daten sind nur so gut wie die Informationen und die Erkenntnis, die aus ihnen mit der richtigen Technologie gewonnen werden kann. In einer Welt, in der Informationen Profit bedeuten, ist es für Unternehmen eine verpasste Chance, nutzlose oder potenziell nicht konforme Daten zu horten. Unternehmen müssen mehr Einsicht in die gespeicherten Daten gewinnen, um entsprechend handeln zu können und die Kontrolle über ihre Daten zu übernehmen. Nur wenige haben vorhergesehen, dass das Wachstum des Datenvolumens die Kontrolle aushebeln könnte. 2016 ist für die Manager das Jahr, den Databerg abzutragen, bevor Organisationen unter seiner Last in die Knie gehen.

Martin Schindler

Martin Schindler schreibt nicht nur über die SAPs und IBMs dieser Welt, sondern hat auch eine Schwäche für ungewöhnliche und unterhaltsame Themen aus der Welt der IT.

Recent Posts

Cloud-Beschleuniger Covid

Vielfach hat die Coronapandemie bestehende IT-Strukturen aufgebrochen oder gar über den Haufen geworfen – gefühlt.…

8 Monate ago

Trends 2021 – Vier Entwicklungen bei (Graph)Datenbanken und Datenanalyse

Das Covid-Jahr 2020 konnte die digitale Transformation nicht ausbremsen. Sogar ganz im Gegenteil: Viele Unternehmen…

10 Monate ago

Ein globales digitales Identitätssystem muss Vertrauen und Transparenz schaffen

Nach Angaben der Weltbank fehlt mehr als einer Milliarde Menschen ein offizieller Identitätsnachweis. Ohne den…

10 Monate ago

Nachhaltigkeit wird zu einem der Schlüsselkriterien in der Tech-Industrie

Das Thema Nachhaltigkeit ist seit vielen Jahren fester Bestandteil des Selbstverständnisses vieler Unternehmen. Wenig verwunderlich,…

10 Monate ago

Chief Data Officer: Garanten für eine stärkere Datennutzung in Unternehmen

Unternehmen sammeln eine Vielzahl von Daten. Doch IDC Analysten fanden in ihrer aktuellen Studie „IDC‘s…

10 Monate ago

Ethik, Regulierungen, Cloud: Der Nebel lichtet sich

COVID-19 hat 2020 sowohl Gesellschaft als auch Wirtschaft bestimmt. Unbestritten ist auch die katalytische Wirkung,…

11 Monate ago