Oliver Schröder

ist Vice President Sales DACH bei Informatica.

Graph-Datenbanken für Master Data Management (MDM) – Was ist dran an dem Hype?

Praktische und technische Argumente, für eine fundierte Entscheidung über die MDM-Implementierung liefert heute Oliver Schröder, Geschäftsführer EMEA Central, Informatica in seinem ersten Blog für silicon.de 

Master Data Management (MDM) bildet keine Ausnahme, wenn es um solche Hypes geht. So erobern beispielsweise derzeit Graph-Datenbanken die Welt der Datenverarbeitung im Sturm. Da bleibt es nicht aus, dass vor allem kleine Startups Graph-Datenbanken aus Mangel an eigenen ausgereiften Lösungen als die große Innovation für MDM positionieren. Während Graphen einige Vorteile für MDM-Lösungen bieten, ist es trotzdem wichtig das Große und Ganze zu betrachten und auch die Nachteile abzuwägen.

open_Data_shutterstock

Der Hype

Graph-Datenbanken stellen stark vernetzte Informationen dar und werden vor allem in Onlinesystemen mit höchsten Performance-Anforderungen eingesetzt. Durch Flexibilität und Agilität der anpassbaren Modelle erzielen sie tatsächlich oft bessere Leistungen als relationale Datenbanken. In Bereichen wie systembasierter Empfehlungen (beispielsweise next best offer), Geodaten, sozialen Netzwerken und Betrugserkennung werden sie besonders häufig verwendet. Da ist es nur logisch, dass sie auch als perfekte Lösung für das Master Data Management angepriesen werden.

Ausgewähltes Whitepaper

Optimierungsbedarf bei Logistikprozessen?

Die Lösung lautet: Dokumentenmanagement. Erfahren Sie im kostenlosen E-Book, wie ein Dokumentenmanagement-System (DMS) Ihnen helfen kann, Ihre Logistikprozesse zu verbessern – von der Artikelnummer bis zur Zustellung. Lesen Sie außerdem, wie Sie ein DMS auch im laufenden Betrieb zeit- und kostensparend implementieren können.

Tatsächlich bieten Graphen dann Vorteile, wenn die Anwendungsfälle auf einem domänenübergreifenden Beziehungsmanagement basieren. Diese Anwendungsfälle sind im Speziellen bei MDM-Lösungen mit einem festen, vordefinierten Datenmodell herausfordernd und hier bieten Graph-Datenbanken funktionale Verbesserungen. Betrachtet man die Probleme, die Master Data Management typischerweise lösen soll, wird die Flexibilität der Technologie allerdings überschätzt. Viele der aufstrebenden Anbieter von Graph-Datenbanken werben mit einer Persistenzschicht, die es erlaubt, Facebook und LinkedIn-ähnliches Beziehungsmanagement zu betreiben. Die Aufrechterhaltung der Datenbeziehungen in einer Persistenzschicht ist in Stammdatenprojekten jedoch gar nicht das Hauptziel. Sie stellt im Grunde genommen überhaupt kein größeres Hindernis dar.

Die Vorteile

Graph-Datenbanken haben beispielsweise folgenden Vorteile:

 

  • Flexibilität: Graphen unterstützen komplexe Datenstrukturen und sind perfekt für die kontinuierliche Datenevolution geeignet. Die erfassten Daten können leicht für weitere Attribute und Objekte geändert und erweitert werden.
  • Suche: Beziehungsbasierte Recherchen können schnell durchgeführt werden – beispielsweise “welcher Anbieter lieferte die Produkte einer bestimmten Kundengruppe?”
  • Indizierung: Graph-Datenbanken werden durch Beziehungen (die Stärke des zugrundeliegenden Modells) indiziert, was einen schnelleren Zugriff im Vergleich zu anderen Modellen ermöglicht.
  • Leistungsfähigkeit: In Graph-Datenbanken stehen Beziehungen direkt zur Verfügung sobald sie eingefügt wurden. Wird eine Abfrage gestartet, folgt die Datenbank vom Startknoten aus den Beziehungen zwischen den Knoten. Die Abfragedauer verhält sich also proportional zur Ergebnismenge und ist in Folge dessen unabhängig von der Menge der Daten in der Datenbank. Es wird also immer nur der abfragerelevante Teil der Datenmenge verarbeitet, was zu schnellen Abfragen führt.
Webinar

Digitalisierung fängt mit Software Defined Networking an

In diesem Webinar am 18. Oktober werden Ihnen die unterschiedlichen Wege, ein Software Defined Network aufzubauen, aus strategischer Sicht erklärt sowie die Vorteile der einzelnen Wege aufgezeigt. Außerdem erfahren Sie, welche Aspekte es bei der Auswahl von Technologien und Partnern zu beachten gilt und wie sich auf Grundlage eines SDN eine Vielzahl von Initiativen zur Digitalisierung schnell umsetzen lässt.

Die Nachteile

Allerdings gibt es noch Raum für die Verbesserung von Graph-Datenbanken im Rahmen von MDM. Hier ein paar Einschränkungen:

  • Einseitigkeit: Graph-Datenbanken sind für etliche operative Anwendungsfälle weniger nützlich, da sie bei der Verarbeitung von hohen Volumina von Transaktionen nicht effizient sind und nicht in der Lage sind, Abfragen zu behandeln, die sich über die gesamte Datenbank erstrecken. Weil sie nicht dafür optimiert sind, Geschäftseinheiten wie Kunden oder Lieferanten zu speichern und abzurufen, müsste eine Graph-Datenbank genaugenommen mit einer relationalen oder einer NoSQL-Datenbank kombiniert werden.
  • Eingeschränkte Funktionalität: Die alleinige Verwendung einer Graph-Datenbank ist noch lange keine vollwertige MDM-Lösung. Diese ist lediglich ein Datenspeicher und stellt keine geschäftsbezogene Benutzeroberfläche zur Abfrage oder Verwaltung von Beziehungen zur Verfügung. Auch erweiterte Abgleichsfunktionen oder Fähigkeiten bezüglich der Datenqualität sucht man vergebens.
  • Datenrelation: Graphdatenbanken schaffen keine besseren Beziehungen. Sie bieten lediglich einen schnellen Datenabruf für bereits verbundene Daten. Diese verbesserte Suche ist ein großer Mehrwert – nützt aber wenig, wenn die Beziehung der Daten untereinander nicht von Anfang an effektiv erfasst wurde.
  • Eingeschränkte Kapazität: Für die gängigsten Graph-Datenbanken müssen alle Daten auf einem Server gespeichert werden. Einige sind beispielsweise auf einen einzelnen Knoten beschränkt und können nicht über einen bestimmten Punkt hinaus skalieren. Reicht die Kapazität des Servers nicht, muss diese auf mehrere Knoten verteilt werden und der Graph in Teilgraphen partitioniert werden.

Spricht man mit Branchenanalysten, wird deutlich, dass Unternehmen auch Bedenken hinsichtlich der Sicherheit von Open-Source-Graph-Datenbanktechnologien äußern. Dieses Thema wird in naher Zukunft sogar noch in der Priorität steigen.

Leseempfehlung:

Gartner widmet der Entwicklung von Trends mit dem „hype cycle for emerging technologies“ eine interessante eigene Studie.