Microsoft hat Pläne für Hadoop

Auch Microsoft entdeckt das Thema Big Data für sich und will jetzt Azure und Windows Server in Hadoop integrieren.

Eine Roadmap verrät weitere Details darüber, wie Microsoft die Big-Data-Lösung Hadoop in Windows Azure und Windows Server integrieren will. Neben Hadoop sind eine Reihe zusätzlicher Tools und Technologien vorgesehen, die zügig im ersten Halbjahr vorgestellt werden sollen.

Microsoft hatte im Oktober eine eigene Distribution von Hadoop angekündigt. Um diese Absicht umzusetzen, arbeitete es mit dem von Yahoo ausgegliederten Hortonworks zusammen. Hadoop ist ein in Java geschriebenes Open-Source-Projekt der Apache Software Foundation, das insbesondere von Yahoo und Google gefördert wurde. Es handelt sich um ein Framework zur Ausführung verteilter Prozesse, das die Verarbeitung und Analyse großer Datenmengen ermöglicht. Zu den Hadoop-Nutzern gehören unter anderem AOL, Baidu, Dell, Facebook, IBM und Oracle.

Mitarbeiter von Microsoft beziehen sich mit dem Codenamen “Isotope” auf die kommende Suite von Produkten und Utilitys, die Hadoop auf Windows Azure und Windows Server unterstützen. Nach der Roadmap, die der ZDNet-Autorin Mary Jo Foley zugespielt wurde, will Microsoft die endgültige Version von Hadoop für Azure am 30. März freigeben. Damit wird erstmals ein genaues Datum bekannt.

Roadmap für Hadoop. Quelle: Microsoft
Roadmap für Hadoop. Quelle: Microsoft

Entwickler bekamen bereits Zugang zu einer eingeschränkten Preview von Microsofts Apache-Hadoop-Distribution, die für Datenanalysen und Analytics-Aufgaben in großem Umfang gedacht ist. Ebenfalls zum 30. März hat Microsoft die Veröffentlichung eines Community Technology Preview (CTP) von Hadoop für Windows Server eingeplant.

Die Roadmap führt außerdem die Tools an, die Microsoft für die Arbeit mit Hadoop bereitstellen will. In einem Webcast hatte Microsoft schon im Dezember erklärt, an einer bidirektionalen Integration mit dem Hadoop-Dateisystem und Hadoop-Tools wie Sqoop und Flume zu arbeiten. Isotope bezeichne mehr als nur die zusammen mit Hortonworks erstellten Distributionen, sondern vielmehr die ganze “Tool-Palette” zur Unterstützung von Big-Data-Analytics, die Microsoft rund um die Hadoop-Distributionen bereitstellt.

[mit Material von Mary Jo Foley, ZDNet.com]