SAPs neuer Ansatz beim Data Warehousing

Mit der Version 7.4 von SAP Business Warehouse führt SAP eine “In-Memory Data Fabric” ein. Damit adressiert SAP das Problem, dass Datawarehouses häufig in Batch-Prozessen gefüttert werden und damit nicht rund um die Uhr auf aktuellem Stand sind. Mit dem Support für HANA können Daten jetzt auch in Echtzeit geschrieben und gelesen werden.

Auf der Kundenkonferenz HANA2014 in Orlando präsentiert SAP Version 7.4 der Datawarehousing-Lösung Business Warehouse. SAP integriert damit nicht nur die HANA-Datenbanktechnologie, sondern auch die HANA-Real-Time-Data-Loading-Technologie in die Warehouse-Lösung.

Nun können Anwender Business Intelligence in Echtzeit gegen dieses Datawarehouse fahren. Das soll den Aufwand für die Datenreplikation reduzieren und Informationen schneller bereitstellen, heißt es vom Hersteller.

SAP spricht bei der neuen Version von einer Revolution, bei der ein Logical-Analytics-Ansatz die klassische Data-Warehousing-Konsolidierung ablöst. Über die Smart-Data-Zugriffstechnologie macht SAP in der neuen Version sämtliche Daten innerhalb und außerhalb des Unternehmens verfügbar. Betriebswirtschaftliche Fragen sollen sich so in Echtzeit beantworten lassen.

Über die Layered Scalable Architecture (LSA) und das neue Metadata Objekt OpenODSView lassen sich jetzt auch externe Datenquellen in Business Warehouse (BW) 7.4 integrieren, ohne die Daten physisch verschieben zu müssen. Quelle: SAP
Über die Layered Scalable Architecture (LSA) und das neue Metadata Objekt OpenODSView lassen sich jetzt auch externe Datenquellen in Business Warehouse (BW) 7.4 integrieren, ohne die Daten physisch verschieben zu müssen. Quelle: SAP

Ohne die Echtzeittechnologie verschieben Betreiber von großen Data-Warehouse-Installationen das Speichern von Informationen in Zeitfenster, in denen wenige Zugriffe geschehen, also an Wochenenden und über Nacht. Mit “Smart Data Access” und mit “In-Memory Data Fabric” löst SAP dieses Problem mit einem neuen architektonischen Ansatz.
Die Daten werden nicht mehr physisch in BW geladen sondern die Technologie behandelt externe Datenquellen als virtuelle Tabellen. Mit dieser Technologie lädt die neue Version häufig verwendete Informationen in die Kernanwendung. Daten, auf die weniger häufig zugegriffen wird, können in den externen Quellen bleiben.

Dafür führt SAP das neue Objekt OpenODSView ein. Über dieses Metadaten-Objekt können auch externe Daten, die noch nicht in das EDW Data Warehouse geladen wurden, über externe Datenstrukturen und Semantiken mit OLAP-Funktionalitäten aus BW behandelt werden.

SAP Business Warehouse 7.4 werde damit zur semantischen Ebene im gesamten Unternehmen, auf der alle Data-Warehousing-, Analyse- und Governance-Aktivitäten in einem kohärenten Geschäftskontext zusammengefasst werden. SAP Business Warehouse 7.4 lagert datenintensive Prozesse, wie Datentransformationen, Planungs- und OLAP-Funktionen nach SAP HANA aus, was wiederum die Performance verbessert.

Das Data Warehouse bleibt so schlank und leistungsfähig und die Daten, auf die zugegriffen wird, sind auf aktuellem Stand. Endbenutzer können Daten aus praktisch allen Quellen oder Systemen heranziehen, ohne sie physisch bewegen zu müssen, versichert SAP. Die neue Version schafft auch die Limitierung von 60 Zeichen pro Spalte ab. Damit können Anwender nun zum Beispiel auch Twitter-Nachrichten samt URL laden.

“Dank der dramatischen Vereinfachung der mit der herkömmlichen Data-Warehouse-Architektur einhergehenden Komplexität sowie der Erweiterung des Funktionsumfangs können wir unseren Kunden nun Analysefunktionen bereitstellen, die zuvor nicht einmal denkbar waren”, kommentiert Steve Lucas, President, Platform Solutions Group, SAP.

SAP hat die Leistungsfähigkeit dieser Lösung bereits mit einem Weltrekord für das Weltgrößte Data Warehouse untermalt. SAP hat in 12 Petabyte Daten auf AWS 8 Millionen Datensätze pro Sekunde unter Einsatz von 1776 Kernen in 111 SAP-HANA-Instanzen laden können. Die Abfrage über die 11 Instanzen hinweg nahm 330 ms in Anspruch. Für eine Abfrage in einer einzelnen Instanz hatte das SAP BW 250 ms gebraucht. Das demonstriere laut Darstellung der SAP, dass sich auch umfassende Skalierungen vornehmen lassen, ohne die Leistungsfähigkeit erheblich zu reduzieren.