Stefan Kolmar

ist Vice President, Field Engineering EMEA & APAC bei Neo4j

Data & StorageDatenbank

NASA – Wissensmanagement mit Knowledge Graph

Am prominenten Beispiel der amerikanischen Weltraumbehörde NASA illustriert Stefan Kolmar von Neo4j, wie ein Knowledge Management System (KMS) dabei helfen kann, vernetztes Wissen nutzbar zu machen.

Datenbanken – egal wie klein oder groß – sind nur dann von Nutzen, wenn relevante Informationen schnell und einfach gefunden werden. Angesichts der wachsenden Komplexität und Konnektivität von Daten ist diese offensichtliche Aufgabe gar nicht so leicht zu erfüllen. Nirgendwo ist das so offensichtlich wie beim geballten und über Jahre gehegten Wissensschatz von Unternehmen.

Das ganzheitliche Erfassen, Teilen, Analysieren, Nutzen und Verwalten von sogenanntem Unternehmenswissen verlangt der IT einiges ab. Veraltete Infrastrukturen und unterschiedliche Datenbanktechnologien verhindern eine Vernetzung der Daten über unterschiedliche Bereiche, Systeme und Standorte hinweg. Noch häufig finden sich Datensilos mit Daten, die kaum oder nie genutzt werden und nur teilweise, wenn überhaupt, in die Datenanalyse eingebunden sind.

Ausgewähltes Whitepaper

CAD-Daten optimal verwalten: ECM-Lösungen vereinfachen Planmanagement

Wie ECM-Systeme CAD-Prozesse verbessern können, was eine gute ECM-Lösung beim Planmanagement auszeichnet und warum sich nscale CAD als spezialisierte Lösung für das Planmanagement anbietet, erklärt dieses Whitepaper.

Zumal sind nicht alle im Unternehmen befindliche Information in Form von Daten, Dokumenten oder digitalen Texten abfragbar und für alle Mitarbeiter gleich zugänglich. Dazu zählen Erfahrungsberichte, Fehleranalysen, Risikobewertungen oder auch Best Practices. Bei der Implementierung von Knowledge Management System (KMS), die heterogene Daten aus unterschiedlichen Systemen in eine Wissensdatenbank zusammenfassen, kann Graphtechnologie ihre Vorteile voll und ganz ausspielen.

Lessons Learned-Datenbank bei der NASA

Die Weltraumorganisation NASA implementierte beispielsweise eine graphbasierte Lessons Learned-Datenbank, die Dokumentationen aus über fünf Jahrzehnten Weltraumforschung umfasst – angefangen bei der Apollo-Mission in den 60er Jahren bis heute. Abgelegt in einem Knowledge Graphen lassen sich die mehr als 10 Millionen Dokumente deutlich besser vernetzen und abfragen. Das Graphmodell ermöglicht eine genaue und einheitliche Taxonomie der Datensätze, wodurch die Dokumente sich entsprechend ihres Inhalts zusammenfassen lassen. In kürzester Zeit finden sich so über Stichwörter relevante Ergebnisse, die Entwickler und Ingenieure teilen und für nächste Projekte nutzen können.

Ausgewähltes Webinar

Praxisleitfaden für den Schutz von Unternehmen vor Ransomware

Helge Husemann, Product Marketing Manager EMEA von Malwarebytes, stellt in diesem 60-minütigen Webinar (Aufzeichnung) die neue Sicherheitslösung Malwarebytes Endpoint Protection vor. Sie enthält ein mehrstufiges Sicherheitskonzept und bietet damit einen effektiven Schutz vor modernen Bedrohungen wie WannaCry, Petya und anderen.

Die Vorteile einer solchen Datenbank liegen auf der Hand: Zusammenhänge zwischen Forschungsbereichen und Projekten lassen sich visualisieren und aufdecken, wodurch Entwicklungszeiten verkürzt und Kosten reduziert werden. Wissens-Silos in Unternehmen werden miteinander verknüpft, so dass ein durchgängiger Wissenstransfer möglich wird. Die Analyse der vernetzten Daten ermöglicht schließlich Trendanalysen, das Erkennen von Mustern und Problemfeldern sowie eine risikoorientierte und datengestützte Entscheidungsfindung.

Knowledge Graph – vom Dokumentenmanagement über Paradise Paper bis KI-Anwendungen

Im Zentrum steht dabei der Knowledge Graph. Grundsätzlich versteht man darunter eine Wissensdatenbank, die über die Zeit hinweg kontinuierlich sowohl mit Rohdaten als auch abgeleiteten Daten angereichert wird.Damit entsteht als Datenmodell ein Graph, der über ein hohes Maß an Detailgenauigkeit, Kontextualität, Intelligenz, Semantik und Zuverlässigkeit (in Bezug auf die Richtigkeit der Daten) verfügt. Dadurch kann das abzubildende Wissen wirklichkeitsnah und genauer erfasst sowie auf sinnvolle und effiziente Weise abgefragt werden.

Schematischer Aufbau einer Lessons-Learnd-Datenbank. (Bild: Neo4J)
Schematischer Aufbau einer Lessons-Learnd-Datenbank. (Bild: Neo4J)

In der Praxis findet sich ein Knowledge Graph beispielsweise im Rahmen des Projekt- und Dokumentenmanagements, für das Masterdatenmanagement, Empfehlungs-, Identity- und Accessmanagementsysteme oder auch Betrugsaufdeckung. Das ICIJ (International Consortium of Investigative Journalists) nutzt die Graphtechnologie zur Analyse der Panama und Paradise Papers.

Auf Grund des Graphmodells lässt sich nachverfolgen, wie Abfragen verlaufen und Ergebnisse zu Stande kommen. Dieser “Weg” kann wiedergegeben und schließlich als Lernbeispiel für ähnliche Anwendungsfälle in der Zukunft herangezogen werden. Je reichhaltiger der Graph dabei wird, desto komplexere Algorithmen können für die Datenabfrage genutzt werden, wobei die Ergebnisse wieder in den Graph zurückfließen. Damit bietet ein Knowledge Graph ein wichtiges Fundament für Anwendungen im Bereich Künstliche Intelligenz.

Klares Ziel: Durchsuchbares und konsistentes Datenrepository

Egal welcher Anwendungsfall, das Ziel eines Knowledge Graphen ist das Gleiche: ein durchsuchbares und konsistentes Repository oder eine Repräsentation eines Repository, in dem institutionelles Wissen gespeichert und zur Verfügung gestellt wird. Davon profitieren insbesondere Forschungs- und Entwicklungsabteilungen, der Kundenservice sowie der Bereich Business Analytics. Grundsätzlich stellt ein solches kontinuierlich gepflegtes Wissensmanagementsystem jedoch über das ganze Unternehmen hinweg eine hohe Konsistenz aller Geschäftsbereiche sicher.

NASA Astronaut Tim Kopra auf seinem Raumspaziergang vom 21. Dezember. (Quelle: NASA)
NASA Astronaut Tim Kopra auf seinem Raumspaziergang vom 21. Dezember. (Quelle: NASA)

Für ein ganzheitliches Management von Wissen sind folgende Punkte zu beachten:

  • Institutionelles Wissen besteht zu großen Teilen aus Legacy-Daten wie Text, so dass eine Lösung gefragt ist, die auf der einen Seite die Integration heterogener Datensätze erlaubt und auf der anderen Seite diese Daten als semantischen Kontext wieder ausgibt.
  • Verbindungen und Beziehungen sowie Ursache-Wirkungs-Korrelation müssen materialisiert und dauerhaft persistent gehalten werden.
  • Alle Informationen müssen indiziert, durchsuchbar und teilbar sein.
  • Die Lösung muss agil, leicht erweiterbar sein und sich an veränderte Geschäftsbedingungen anpassen lassen.
  • Gefragt ist eine Lösung die Graphtechnologie mit textbasierten NLP (Natural Language Processing) sowie anderen Technologien kombiniert.
  • Informationen müssen anschaulich visualisiert und für Prozesse und Workflows genutzt werden können.

Knowledge Management System (KMS), die auf Basis eines Knowledge Graphen arbeiten, können diese Anforderungen erfüllen. Dabei stellt Graphtechnologie die zentrale Plattform, um Daten und Datenverbindungen zu speichern, zu strukturieren und in einen semantischen Kontext zu rücken, der neue Einblicke in das eigene Unternehmenswissen eröffnet, Wissenslücken offenbart und den Aufbau neues Wissen ermöglicht.