Oracle visualisiert Hadoop

Mit Big Data Discovery stellt Oracle ein neues Portfolio vor, über das sich Datensätze aus Hadoop finden und darstellen lassen. Oracle ist indes nicht der Einzige Anbieter, der derzeit Lösungen rund um den Hadoop Data Lake anbietet.

Oracle stellt neue Tools vor, mit denen die quelloffene Lösung Hadoop einfacher in eine Unternehmensumgebung eingebracht werden könne. Oracles Ziel ist, sich hier als Schnittstelle zu dem so genannten Data Lake zu positionieren. Die neuen Produkte heißen: Oracle Big Data DiscoveryOracle GoldenGate for Big DataOracle Big Data SQL 1.1 und Oracle NoSQL Database 3.2.5.

Damit treibt Oracle auch die Kompatibilität zwischen Hapdoop, NoSQL und SQL weiter voran. Mit Oracle Big Data Discovery, einem End-to-End-Produkt, will der Hersteller die Analyse und Visualisierung von Hadoop verbessern. Damit lasse sich auch die Zahl der Anwendungen steigern, die Informationen aus dem Datenpool herausziehen können.

Oracle bietet laut eigenen Angaben eine "Visualisierung für Hadoop". (Bild: Oracle)
Oracle bietet laut eigenen Angaben eine “Visualisierung für Hadoop”. (Bild: Oracle)

Ebenfalls Teil der neuen Ankündigung ist GoldenGate for Big Data. Diese Technologie ist ebenfalls Hadoop-basiert und ermöglicht es, unstrukturierte Daten aus verschiedenen transaktionalen Systemen in ein Big Data System zu streamen. Damit lassen sich laut Oracle auch bestehende Real-Time-Architekturen für neue Big-Data-Projekte nutzen. Als Zielsysteme werden derzeit Apache Hadoop, Apache Hive, Apache HBase und Apache Flume unterstützt.

Mit Big Data SQL 1.1 verbindet Oracle SQL mit Hadoop and NoSQL. Damit lassen sich Abfragen in SQL erstellen und automatisch in die Welt von Hadoop und NoSQL übersetzen. Mit Big Data SQL 1.1 verbessert Oracle die Integration zwischen Hadoop und der Oracle-Datenbank. Zudem steigere die neue Version die Query-Performance um bis zu 40 Prozent.

Die NoSQL Database 3.2.5 ermöglicht die Entwicklung moderner Anwendungen. Die neue Version unterstützt vorhersagbare und niedrige Latenzen, RESTful API sowie eine Thrift-based C API. Zudem integriert sich die neue Version in die Oracle Big Data Plattform. Auf Basis von Big Data SQL oder Oracle NoSQL Database 3.2.5 unterstützt die Datenbank auch Die Data Definition Language (DDL). Auch damit lassen sich über herkömmliches SQL Abfragen in den NoSQL Data umsetzen.

Oracle Golden Gate schlägt eine Brücke zwischen traditionellem SQL und NoSQL-Datenbanken. (Bild: Oracle)
Oracle Golden Gate schlägt eine Brücke zwischen traditionellem SQL und NoSQL-Datenbanken. (Bild: Oracle)

Big Data Discovery liefert jetzt eine ansprechende und übersichtliche Nutzerschnittstelle, um Rohdaten in Hadoop auszuwerten. Damit lassen sich statistische Korrelationen zwischen Datenattributen identifizieren. Um interessante Kombinationen herauszufiltern können Nutzer durch einen visuellen Daten-Katalog über Guided Navigation und neuen Such-Funktionen browsen.

Oracle Big Data Discovery verkürzt auch die Vorbereitung der Daten für die Analyse über ein Spreadsheet-artiges Tool. Damit können Nutzer Daten visuell verbessern oder augmentieren und das ohne Programmierkenntnisse. Das neue Oracle-Tool erlaube es dann auch gleich von der Vorbereitung zur Auswertung zu wechseln. Die Anwender können an den Daten zusammenarbeiten oder die Ergebnisse wieder in Hadoop, Pig, Hive oder Python zurückschreiben.

“Daten sind das neue Kapital und Unternehmen müssen strategisch in ihr Datenkapital investieren, um den besten Nutzen daraus ziehen zu können”, so Neil Mendelson, Vice President Big Data bei Oracle. “Oracle liefert Anwendern eine integrierte Plattform, die den Zugriff auf sämtliche Daten vereinfacht, neue Einsichten erleichtert und Ergebnisse in Echtzeit vorhersagt und darüber hinaus sämtliche Daten sicher verwaltet.”

Diese neuen Ankündigungen sind zudem für die Oracle Big Data Appliance X5 and Oracle Exadata Database Machine X5 optimiert, teilt der Hersteller mit.

Neben Oracle haben auch EMC und Pivotal neue Lösungen rund um den Hadoop-Data-Lake vorgestellt. Alle diese Produkte haben das gemeinsame Ziel, die Auswertung von Big Data für Unternehmen viabel zu machen.

“Eine Technologie alleine wird nicht länger ausreichen, um alle analytischen Anwendungsfälle abzudecken”, kommentiert Dan Vesset, Vice President of Business Analystics Research bei IDC. “Gleichzeitig wird das Daten-Management und die Analyse eine Serie von unzusammenhängenden Projekten, die einen nicht mehr zu verwaltenden Morast an IT-Struktur bilden, was zu unnötigen Risiken führt.” IDC erwarte daher, dass im Jahr 2017 eine einheitliche Daten-Plattform-Architektur die Grundlage für eine unternehmensweite Big-Data- und Analytics-Strategie sein wird. Diese Vereinheitlichung betreffe Informations-Management, Analyse- und auch Suchtechnologien.

Wie groß ist Ihr Wissen über Big Data? Machen Sie den Test mit 15 Fragen auf silicon.de.