Kraftpaket jongliert mit Daten

EnterpriseSoftware

Ein Data-Warehouse bringt die Statistik auf Trab

Daten aus 2100 Schulen von über 57 000 Lehrern und 800 000 Schülern – das ist das Mengengerüst, aus dem das hessische Kultusministerium Planungs- und Statistikinformationen gewinnt. Doch erst seit kurzem gibt es dafür auch ein Data-Warehouse.

Die Einrichtung dieses Datenpools steht in Zusammenhang mit der Einführung eines landesweiten Verfahrens, genannt LUSD, für die Schulverwaltung. Dieses Access-basierte Desktop-System gibt es seit rund fünf Jahren. Doch erst jetzt wurde es für alle Schulen verbindlich eingeführt.

Damit liegen aber auch zum ersten Mal sämtliche Informationen in elektronischer Form vor. Vorher gab es eine Mischform der Datenerfassung. Zum Teil haben bis dato Schulen ihre Daten noch auf Papierformulare eingetragen und an das statistische Landesamt verschickt. Dort wurden sie teilweise mit Scannern gelesen oder von Hand in das Großrechnersystem des Amts übertragen. Immerhin dienen diese Daten als Planungs- und Statistikgrundlage für das gesamte Bundesland.

Es gab eine Vielzahl an Datenquellen und -formaten, die an verschiedenen Stellen eingegeben wurden. Darunter litt die Datenqualität erheblich. Die Rohdaten enthielten Fehler, waren uneinheitlich strukturiert und mussten oft nachbehandelt werden. Der Aufwand an Zeit und Personal war immens.

Mit der elektronischen Erfassung direkt vor Ort in den Schulen ändern sich die Vorraussetzungen. Die LUSD-Anwendung gibt eine stark normalisierte Datenstruktur vor. Die Informationen müssten leicht übertragbar und zu gewinnen sein.

Doch noch gibt es keinen durchgängigen elektronischen Datenfluss. Das liegt zum einen an der Desktop-Anwendung selbst, die an keinem Netz hängt. Zum anderen aber existieren auch keine sicheren Leitungen von den Schulen zum Kultusministerium und zum Statistikamt.

Vielmehr speichern die Schulen die gesammelten Informationen auf Disketten, die dann das Landesamt einsammelt. Die Datenträger enthalten im Wesentlichen Verweise auf Schlüssel, beziehungsweise Tabellen.

Das statistische Landesamt bereitet die Daten für seine eigenen Auswertungen auf und überträgt sie dann per FTP tatsächlich zur Hessischen Zentrale für Datenverarbeitung, die die Data-Warehouses des Kultusministeriums hostet.

Das Kultus-Data-Warehouse basiert im Wesentlichen auf einem Produkt der Firma Informatica. Für den Import der Daten werden in diesem Fall ODBC-Schnittstellen genutzt. Bestandteil von Datacenter sind Tools, die das Extrahieren, Transportieren und Laden (ETL) erledigen.

Denn neben den Informationen aus dem Schulverwaltungssystem sollen im kommenden Jahr auch beispielsweise auch Daten aus der R/3-Anwendung des Landes Hessen in das Data-Warehouse einfließen, verrät Jens Fischer-Kottenstede, verantwortlicher Projektleiter aus dem zuständigen Referat des hessischen Kultusministeriums.

Doch schon jetzt ist das Datenaufkommen enorm. In Stoßzeiten muss das System einen Durchsatz von rund acht Millionen Datensätzen verkraften. Dafür ist das System, auf dem die Informatica-Anwendung installiert ist, relativ klein. Hardwareseitig reicht derzeit ein IBM Netfinity mit einem Prozessor. Die verwendete Datenbank ist der SQL Server von Microsoft. Hierauf läuft das Repository des Kultus-Data-Warehouse.

Für die Auswertungen nimmt das Kultusministerium allerdings nicht die Tools von Informatica. Es blieb bei den auch bisher schon im Einsatz befindlichen Analyse-Werkzeugen von Chrystal Reports. Die Berichte und Ad-hoc-Abfragen laufen auf einem Cluster aus Zwei-Prozessor-Maschinen von Fujitsu-Siemens. Darauf laufen Informix- und SQL-Server-Datenbanken.

“Unser Ziel war es, komplexe Daten aus einer großen Zahl dezentraler Access-Anwendungen automatisiert zu integrieren und sie mit anderen aus operativen Systemen zu verbinden”, fasst Projetleiter Fischer-Kottenstede zusammen. Nun hat er das erste wichtige Etappenziel geschafft.

silicon meint: Noch immer ist die Lösung des hessischen Kultusministerium nicht perfekt. Es fehlt für den effektiven Informationsfluss schlichtweg eine Datenleitung, an die die Desktop-Anwendung, die nun ohnehin in allen Schulen identisch ist, angeschlossen werden kann. Doch ein großes Stück Arbeit dürfe mit der Inbetriebnahme des Data-Warehouse geschafft sein. Das ist ein Zeichen: Auch Schulbehörden kommen in der Neuzeit an.