Pivotal HD 2.0 erleichtert Unternehmen Datenanalyse in Hadoop

Abfragen in Hadoop lassen sich mit Pivotal HD 2.0 nun auch über eine Echtzeit-SQL-Datenbank erstellen, Anwender müssen daher keine neuen Tools lernen.

Echtzeit-Daten-Analyse mit Pivotal HD, HDFS und Hadoop. Quelle: Pivotal
Echtzeit-Daten-Analyse mit Pivotal HD, HDFS und Hadoop. Quelle: Pivotal

Pivotal, eine Ausgründung von EMC und VMware, stellt mit Pivotal HD 2.0 eine kommerziell unterstützte Hadoop-Distribution für den Enterprise-Bereich vor. Pivotal HD 2.0 basiert auf Adpache Hadoop 2.2 und erweitert die quelloffene Technologie mit proprietären Technologien. Parallel dazu stellt Pivotal auch den In-Memory-Datenbank-Dienst GemFire XD vor. Gemeinsam bilden diese beiden Produkte eine Big Data Analytics Plattform, auf die dann datengetriebene und analytische Anwendungen zugreifen können.

Zielgruppe dieser neuen Produktgruppe sind Unternehmen, die schnell und im großen Stil Echtzeit-Datenanalyse konsumieren wollen. Über die proprietäre Technologie HAWQ, einer Query-Engine für SQL, können Anwender SQL-Abfragen erstellen und diese dann automatisiert in parallelisierte Abfragen im Hadoop Distributed File System (HDFS) übersetzen. Entwickler und Anwender müssen dadurch nicht erst neue Hadoop-Tools erlernen.

“Um es einfach zu erklären: HD verwendet die Fähigkeiten des allgegenwärtigen Datamanagement-Systems von Hadoop und bündelt es mit zwei weiteren Services”, so Nikesh Shah, Principal Product Marketing Manager für Pivotal HD in einem Blog. “Erstens eine In-Memory SQL Database, die es erlaubt, Daten zu füttern, zu verarbeiten, zu analysieren und in Echtzeit zu nutzen und zweitens ein leistungsfähiges Set von Analytischen Services.”

Die Version 2.0 von HD erweitert darüber hinaus den Support für die Sprachen R, Python und Java. Damit können Anwender Prozesse und Business-Logiken auch auf Hadoop nutzen, die ansonsten mit SQL geläufig sind. Möglich macht das die Integration von MADlib und GraphLab, einem Paket aus Graph-Analytic-Algorithmen, die zur Visualisierung und bei maschinellem Lernen eingesetzt werden.
HD basiert auf der Pivotal-Architektur Data Lake, einem Plattform-as-a-Service-Angebot für Big Data Analytics, die Pivotal zusammen mit der Unternehmensberatung Capgemini umsetzt.

Pivotal wurde 2012 von EMC und dem Tochterunternehmen VMware mit finanzieller Unterstützung von General Electric gegründet. Seit knapp einem Jahr ist Pivotal ein eigenständiges Unternehmen, das die Themen PaaS, Big Data und Entwicklung abdeckt. Im Februar vergangenen Jahres hatte Pivotal zum ersten Mal öffentlich von HD gesprochen. Version 1.0 kam im vergangenen Sommer auf den Markt.

Pivotal HD integriert zwar zahlreiche Apache-Technologien erweitert diese jedoch mit proprietären Anwendungen wie GemFire XD oder HAWQ. Die Lösung richtet sich vor allem an große Unternehmen. Quelle: Pivotal
Pivotal HD integriert zwar zahlreiche Apache-Technologien erweitert diese jedoch mit proprietären Anwendungen wie GemFire XD oder HAWQ. Die Lösung richtet sich vor allem an große Unternehmen. Quelle: Pivotal