Intel investiert in Hadoop-Distributor Cloudera

Die Hadoop-Plattform CDH soll Cloudera für Intels Architektur optimieren. Als Gegenleistung will Intel die Vermarktung bei den eigenen Kunden übernehmen. Auch ein Sitz im Aufsichtsrat von Cloudera beinhaltet die Kooperation.

Nach dem Intel die eigene Hadoop-Distribution nicht mehr weiterentwickelt, investiert es in Cloudera. Der Prozessorhersteller nennt es in einem Blog die bislang größte Investition in Rechenzentrumstechnologie. Die Höhe des Betrags nennt es allerdings nicht.

hadoop-elephant_640x480Ende Februar 2013 hatte Intel die eigene Hadoop-Distribution präsentiert. Die Lösung hat es auf die eigenen Prozesse optimiert und sollte “das Beste aus Intel-Hardware und -Software für höhere Leistung und Sicherheit” bieten. Damit tat es EMC gleich, das kurz zuvor mit Pivotal HD in den Wettbewerb mit etablierte Hadoop-Distributoren wie Cloudera einstieg. Intel hat die Strategie nun geändert und will eng mit Cloudera zusammenarbeiten.

Die beiden Unternehmen haben sich darauf verständigt, dass Cloudera die auf Apache Hadoop basierende Distribution CDH für Intels Architektur als bevorzugte Plattform entwickelt und optimiert. Es plant auch, eine Reihe Next-Generation-Techniken zu unterstützen. Dazu zählen Intels HPC-Produkte, Flashspeicher und Sicherheit. Intel wird im Rahmen der Kooperation CDH und Cloudera Enterprise bei eigenen Kunden als bevorzugte Hadoop-Plattformen vermarkten und bewerben.

“Durch die Angleichung der Roadmaps von Cloudera und Intel schaffen wir eine erstklassige Plattform zur Big-Data-Analyse”, sagt Diane Bryant, Senior Vice President und General Manager von Intels Data Center Group. “Wir erwarten uns davon eine beschleunigte Verbreitung der Hadoop-Data-Plattform und ermöglichen es Unternehmen, ihre Daten nach geschäftsfördernden Erkenntnissen zu durchsuchen.”

Die Verbesserungen von Intels Distribution for Apache Hadoop (IDH) beziehungsweise der Intel Data Platform (IDP) sollen in CDH integriert werden. Der Übergang von IDH/IDP auf CDH ist nach dem Release 3.1 für Ende März geplant. Ein Migrationspfad soll in gemeinsamer Arbeit von Intel und Cloudera erstellt werden. Auch CDH sowie die Open-Source Projekte von Cloudera erhalten nach Unternehmensangaben die Optimierungen.

Die Kooperation enthält für Intel zudem einen Sitz in Clouderas Aufsichtsrat. Der Hadoop-Distributor hatte erst kürzlich Investitionen von 160 Millionen Dollar erhalten. Für dieses Jahr plant das Unternehmen angeblich den Gang an die Börse.

CDH ist eine der meistgenutzten Hadoop-Distributionen. Es bietet unterschiedliche Werkzeuge für die Speicherung und Analyse von Daten in Hadoop-Clustern. Es enthält unter anderem Software mit der Abfragen von SQL-Datenbanken und Suchmaschinen in Echtzeit möglich sind. Auch Programme für Maschinelles Lernen, Sicherheit und Verarbeitung von Datenströmen sowie von Batch-Daten sind integriert. Andere beliebte Distributionen kommen von Hortonworks, MapR und Pivotal, einem Joint Venture von EMC und VMware.

[mit Material von Björn Greif, ZDNet.de]

Wie groß ist Ihr Wissen über Big Data? Machen Sie den Test mit 15 Fragen auf silicon.de.