Otto Neuer

ist VP Sales EMEA Central bei Talend.

Data & Storage

Wie Open Data durch die aktuelle Gesetzgebung vorangetrieben wird

Daten gelten für viele Organisationen als ein wichtiger Wirtschaftsfaktor. Dies hat auch die Bundesregierung erkannt und so gilt seit dem 13. Juli 2018, dass Behörden der unmittelbaren Bundesverwaltung nach dem Gesetz zur Förderung der elektronischen Verwaltung (EGovG) von ihr erhobene Rohdaten veröffentlichen müssen.

Was ist Open Data aber überhaupt? Diese frei verfügbaren Daten sind Informationen, die ohne Einschränkungen für beliebige eigene Zwecke verwendet werden können – also auch für die kommerzielle Nutzung. Zu Open Data zählen beispielsweise Geodaten, Statistiken, Verkehrsinformationen, wissenschaftliche Publikationen, medizinische Forschungsergebnisse oder auch Hörfunk- und Fernsehsendungen sowie Lehrmaterial. Solche Daten stammen von staatlichen Stellen, privatwirtschaftlichen Unternehmen, Hochschulen oder sonstigen Non-Profit-Organisationen. Welche Open Data-Quellen heute schon für Firmen nutzbar sind und wie sich diese integrieren lassen, zeigt der folgende Beitrag.

Notebook-Netzwerk (Bild: istock)

Warum aber gibt es überhaupt kostenfreie Datensammlungen? Hier spielen Initiativen und Gesetze des Staates eine große Rolle. Ein Beispiel ist das Informationsfreiheitsgesetz, denn die Informationsfreiheit gilt in Deutschland als ein wichtiges Bürgerrecht: Es gestattet die Einsicht in Dokumente und Akten der öffentlichen Verwaltung. Seit einigen Jahren hilft das Portal fragdenstaat.de interessierten Bürgern dabei, ihre Anfragen bequem bei Behörden einzureichen. So hat sich das Portal zu einer Sammelstelle für amtliche Informationen entwickelt. Bei den Bürgerfragen geht es zum Beispiel um die Verwendung von öffentlichen Geldern für die Stadtverwaltung oder wie sich der Fuhrpark von Bundestagsabgeordneten zusammensetzt. Die dort veröffentlichten Informationen zeigen anschaulich, welche vielfältigen und interessanten Daten bei den Behörden schlummern. Aber erst durch Open Data-Initiativen werden aus einzelnen Verwaltungsdaten auch maschinenlesbare Datenbestände, die sich für eine Weiterverarbeitung durch Dritte eignen.

Maschinenlesbare Daten veröffentlichen

Um die Verbreitung von Daten weiter zu beschleunigen, hat sich die öffentliche Verwaltung dem Prinzip „Open Data by Default“ verpflichtet. Damit sollen Behörden ermutigt werden, geeignete Daten grundsätzlich öffentlich zu stellen. Für Unternehmen ergibt sich dadurch ein erhebliches wirtschaftliches Potenzial, wenn große Informationsmengen als Open Data verfügbar werden. Unternehmen können diese frei verfügbaren Daten mit bestehenden Informationen verknüpfen und so einen Mehrwert für bestehende oder neue Geschäftsprozesse schaffen. Ein Beispiel hierfür sind Versicherungen, die Wetterdaten für eine Risikoanalyse verwenden. Auch die Deutsche Bahn unterstützt Open Data und Entwickler haben basierend darauf Apps rund um die Reiseplanung veröffentlicht.

24 h geöffnet dank Open Government

Zentrale Anlaufstelle für frei verfügbare Verwaltungsdaten in Deutschland ist das GovData-Portal: Hier bieten öffentliche Stellen aus Bund, Ländern und Kommunen vielfältige Daten der Verwaltung an. Beispielsweise hat der Freistaat Bayern bereits über 800 Datensätze in seinem Open Data-Portal bereitgestellt, darunter 200 verschiedene Geodatensätze. Diese informieren über Schutzgebiete, den Breitbandausbau oder über kommunale Bauprojekte und die Lage von Leerrohren. Zum Vergleich: Das unter www.europeandataportal.eu erreichbare europäische Datenportal referenziert rund 790.000 Datensätze.

Interessenkonflikte

Allerdings gibt es auch kontroverse Diskussionen rund um Open Data. So kann es zum Beispiel vorkommen, dass durch Steuergelder geförderte Informationssammlungen in Konkurrenz zu kommerziellen Angeboten stehen. Vermeintlich benachteiligte Unternehmen berufen sich dann auf das Wettbewerbsrecht. Ein Beispiel ist die Tagesschau-App, die GEZ-finanzierte Nachrichten auf mobile Geräte bringt und so im Wettbewerb mit werbefinanzierten Medien steht.

Otto Neuer ist Vice President Sales EMEA Central von Talend und steuert die Vertriebs- und Channel-Aktivitäten. Talend bietet Software-Lösungen für Cloud- und Big Data-Integrationen und unterstützt Unternehmen darin, aus ihren Daten strategische Wirtschaftsgüter zu entwickeln (Bild: Talend)
Otto Neuer ist Vice President Sales EMEA Central von Talend und steuert die Vertriebs- und Channel-Aktivitäten. Talend bietet Software-Lösungen für Cloud- und Big Data-Integrationen und unterstützt Unternehmen darin, aus ihren Daten strategische Wirtschaftsgüter zu entwickeln (Bild: Talend)

Brisante Insider-Informationen

Eine ganz andere Art von Open Data sind vertrauliche Informationen, die über Indiskretionen oder Hackerangriffe veröffentlicht wurden, wie beispielsweise die auf der Wikileaks-Plattform verfügbaren Unterlagen. Ein anderes Beispiel sind die „Panama Papers“, vertrauliche Dokumente des panamaischen Offshore-Dienstleisters Mossack Fonseca. Diese wurden von dem „Internationalen Konsortium Investigativer Journalisten“ (ICIJ) veröffentlicht. Rund 2,6 Terabyte an Daten zu Briefkastenfirmen, Steueroasen und Steuerschlupflöchern gelangten an die Öffentlichkeit. Die aus den Panama-Papieren gewonnenen Informationen wurden von dem ICIJ aufbereitet und in einer Datenbank bereitgestellt. Hierzu wurden Open Source-Technologien verwendet: Beispielsweise unterstützte Talend, Spezialist für Datenintegration, mit seiner Technologie dabei, die Rohdaten in eine spezielle Open Source-Graphdatenbank zu überführen, sodass die Unterlagen sehr einfach von der Öffentlichkeit einsehbar sind. Nach dem gleichen Prinzip wurden die „Paradise Paper“ veröffentlicht, die zeigen, wie Superreiche und multinationale Konzerne ihre Steuerlast senken.

Datenintegration mit der Cloud

Wer als Unternehmen die vielfältigen Datenschätze für neue Geschäftsmodelle nutzen möchte, hat es heute so einfach wie nie zuvor. Denn: Die Cloud bietet flexibel skalierbare IT-Ressourcen, mit deren Hilfe sich sehr rasch eine leistungsfähige Infrastruktur für das Datenmanagement aufbauen lässt. Von Rechenleistung und Speicherkapazität über Datenbank-Services bis hin zu Cloud-Leistungen für maschinelles Lernen sind heute alle notwendigen IT-Services aus der Cloud verfügbar. Überspitzt ausgedrückt, müssen sich Manager nur noch einen Business-Case ausdenken und die IT-Experten können mit wenigen Mausklicks und ohne kostenintensive Investitionen in Hardware selbst größte Datenmengen in der Cloud analysieren.

Beispiele für den Einsatz von Open Data

Wie die Ausführungen zeigen, ist das Potenzial für Open Data enorm. Ein Vergleich mit Open Source-Software und Open Data lässt erahnen, welche Veränderungen sich durch offene Daten für die Wirtschaft und Gesellschaft ergeben: So hat das quelloffene Betriebssystem Linux zu einem komplett eigenständigen kommerziellen Marktsektor rund um die Beratung und Implementierung dieser kostenfreien IT-Plattform geführt. Weiterhin etablierte sich Wikipedia als kostenfreie Enzyklopädie und mit OpenStreetMap wurden frei nutzbare Geodaten zu digitalen Landkarten verarbeitet. Weitere prominente Beispiele sind die Weltbank, die globale Entwicklungsdaten anbietet, oder das Statistische Bundesamt, über das Bürger und Unternehmen stets aktuelle Informationen zur Entwicklung von Wirtschaft und Gesellschaft abrufen können. So wurden im Laufe der Jahre freie Informationen und freie Daten für die wirtschaftliche Entwicklung von Unternehmen, aber auch für die Weiterentwicklung der Gesellschaft, immer wichtiger.