Big Data und Open Source

Es sind vor allem quelloffene Technologien, die für Big-Data-Projekte verwendet werden. Inzwischen reagieren auch erste Anbieter proprietärer Produkte mit entsprechenden Angeboten.

Nach wie vor scheint das Interesse an Open-Source-Technologien bei Entwicklern ungebrochen. Das belegen steigende Download-Zahlen von Software-Infrastrukturen sowie Konnektoren zu Software-Paketen. Vor allem so genannte NoSQL-Datenbanken und Erweiterungen für Hadoop werden häufig geladen, wie der Business-Intelligence-Anbieter Jaspersoft in einem Report meldet.

Dafür hat das Open-Source-Unternehmen die Download-Zahlen auf dem hauseigenen Entwickler-Portal JasperForge ausgewertet. Besonders beliebt seien demnach Technologien für Storing, Analyzing und für die Visualiserung von großen Datensätzen.

Jaspersoft sieht zudem stark steigendes Interesse. So wuchsen im zweiten Quartal die Download-Zahlen um 92 Prozent im Vergleich zu 2011. Zudem seien über 10.000 Konnektoren – damit lassen sich verschiedene Datenquellen zusammenschließen – herunter geladen worden.

Die meisten Downloads entfallen auf NoSQL-Datenbanken. Und MongoDB, so Jaspersoft, führe hier deutlich vor anderen Projekten. Stark wachsenden Zuspruch findet auch die Datenbank Cassandra. Das Data-Ware-House-Projekt für Hadoop Hive hingegen wachse seit 2011 kontinuierlich.

Offenbar haben jetzt auch proprietäre Anbieter wie VMware die Zeichen der Zeit erkannt. Mit Serengeti hat die EMC-Tochter jetzt einen quelloffenen Hadoop-Konnektor für die VMware vSphere-Cloud veröffentlicht.