Index zeigt Nachfrage nach Big-Data-Quellen

Der Open-Source-BI-Experte Jaspersoft hat den ‘Big Data-Index‘ vorgestellt. Der Index erfasst nach Angaben des Unternehmens die Nachfrage nach populären Big-Data-Quellen wie ‘Hadoop Hive’, ‘Hadoop HBase’, MongoDB und Cassandra.

Bild: Screenshot
Bild: Screenshot

Der Index ermöglicht demnach das Erstellen eines Rankings für Konnektor-Downloads führender Datenbanken und Frameworks, die zur Verwaltung massiver Datenvolumen verwendet werden. Die Daten basieren auf der Gesamtzahl der nativen Konnektoren, die von JasperForge, der Open-Source-Website des Unternehmens, heruntergeladen wurden.

Aus den von Januar 2011 bis Januar 2012 erfassten Download-Daten hat Jaspersoft Wachstumstrends für die Big-Data-Analyse abgeleitet und eine Rangfolge der einzelnen Datenquellen erstellt. Die wichtigsten Erkenntnisse des ersten Big Data-Index lauten:

  • Weltweit wurden 2011 mehr als 15.000 Big Data-Konnektoren heruntergeladen.

  • Die dokumentenorientierte NoSQL-Datenbank MongoDB verzeichnete den größten Wachstumsschub und konnte 2011 um mehr als 200 Prozent zulegen.

  • Hadoop Hive, die SQL-Schnittstelle zu Hadoop MapReduce, vereinte 60 Prozent der gesamten Nachfrage nach Hadoop-basierten Konnektoren auf sich.

  • Die verteilte Hadoop-Umgebung Hadoop HBase belegte Rang 2 der beliebtesten Konnektoren auf Hadoop-Grundlage.

  • Die hochverfügbare NoSQL-Datenbank Cassandra gehörte 2011 zu den vier am häufigsten heruntergeladenen Big Data-Quellen.

  • Mehr als 27 Prozent der Big Data-Konnektor-Downloads entfielen auf Riak, Infinispan, Neo4J, Redis, CouchDB, VoltDB und andere.

“Der Index zeigt, dass es in der BI drei gängige Herangehensweisen für den Zugang zu Big-Data-Umgebungen gibt: Reporting und Analyse mittels direkter Konnektivität, direktes Reporting im Batch-Verfahren und die Extraktion von Daten durch Batch-ETL-Prozesse und deren Übernahme in ein zentrales Data Warehouse oder eine Datenbank”, sagt Karl Van den Bergh, VP Products & Alliances bei Jaspersoft.

Die Unternehmen wollten variable Optionen für die Big-Data-Analyse, da jeder Anwendungsfall ganz eigene Anforderungen stellte. “Während einige der Unternehmen direkte und sofortige Antworten von ihren Big Data-Quellen erwarten, verfolgen andere einen eher klassischen Ansatz mit periodisch erstellten Berichten.”