MapR wird Spark-Distributor

Mit der Converged Data Platform unterstützt MapR bereits seit geraumer Zeit die Big-Data-Technologie Spark. Immer mehr Anwender nutzen das quelloffene Apache Spark als primäre Compue-Engine. Nun hat der Anbieter mit der eigenen Spark-Distribution jetzt eine integrierte Compute- und Storage-Engine für Analysen, Batch-Processing und die Echtzeit-Verarbeitung von Daten vorgelegt.

Die Distribution richtet sich an Unternehmen und soll vor allem die Funktionen des Frameworks mit den Features der MapR-Converged Data Plattform kombinieren. Damit werde die Handhabung der Sprache einfacher und auch zuverlässiger, verspricht Hersteller MapR.

Die MapR Converged Data Plattform mit den Unterstützten Engines, Anwendungen und Tools. (Bild: MapR)

Die MapR-Spark-Distribution enthält die jüngste Version von Apache Spark und damit auch Features für das In-Memory-Processing von Big Data. Dadurch soll auch eine schnellere Entwicklung von Anwendungen und die Wiederverwendung von Code über Batch-, Interactive- und Streaming-Anwendungen hinweg möglich sein.

MapR will die Distribution auch als Quick Start Solution anbieten, die vorgefertigte Templates, Konfiguration und Installation umfasst. Damit sind einige gängige Einsatzbereiche von Spark wie etwa der Aufbau von Datenpipelines oder die Entwicklung von Machine-Learning-Analyse-Anwendungen schon vorbereitet.

Die verschiedenen Komponenten der MapR-Spark-Distribution, die in erster Linie Funktionen aus der MapR-Plattform integriert. (Bild: MapR)

Die Spark-Distribution unterstützt darüber hinaus erweiterte Analysen wie Batch-Processing, maschinelles Lernen, prozedurales SQL und Graph Computing.

Die MapR-Version kann darüber hinaus auch Technologien aus der MapR-Plattofrm wie Web-Scale-Storage, hohe Verfügbarkeit, Mirroring, Snapshots, NFS, Integrated Security oder Global Namespace nutzen. Die Spark-Distribution lässt sich zudem über MapR-Streams, MapR-DB und Hadoop als Add-ons für Echtzeit-Streaming oder Operational Analytics erweitern.

Umfragen zeigen, dass die Nutzerzahlen von Apache Spark in Zukunft stark wachsen: 16 Prozent der Unternehmen nutzen Spark bereits, weitere 47 Prozent denken über den Einsatz nach”, so Nik Rouda, Senior Analyst bei dem Marktforschungsinstitut ESG. “Allerdings benötigen Unternehmen eine verlässliche Plattform, die den Herausforderungen ihres Tagesgeschäfts gewachsen ist.”

MapR Platform including Spark ist im Rahmen der MapR Converged Community Edition und der MapR Converged Enterprise Edition verfügbar.

Martin Schindler

Martin Schindler schreibt nicht nur über die SAPs und IBMs dieser Welt, sondern hat auch eine Schwäche für ungewöhnliche und unterhaltsame Themen aus der Welt der IT.

Recent Posts

Bericht: Nvidia gibt Übernahme von ARM auf

Angeblich trifft der US-Chiphersteller erste Vorbereitungen für die Rücknahme seines Kaufangebots. Auslöser sind die geringen…

22 Stunden ago

Topics: Google stellt neuen Cookie-Nachfolger vor

Er löst den gescheiterten Vorschlag FLoC ab. Google verspricht mit Topics mehr Transparenz und Einflussnahme…

23 Stunden ago

Microsoft steigert Umsatz und Gewinn im zweiten Fiskalquartal

Die Cloud-Sparte ist erneut ein wichtiger Wachstumsmotor. Aber selbst das Geschäft mit Windows-OEM-Lizenzen erzielt ein…

24 Stunden ago

Aktives Scannen: den Hackern einen Schritt voraus

In der vernetzten Produktion wachsen IT und OT zusammen. Damit steigt das Sicherheitsrisiko deutlich bis…

2 Tagen ago

Covid-19-Impfkampagne: Digitale Koordination von Impfterminen

Kassenärztliche Vereinigung Schleswig-Holstein setzt auf Online-Portal mit Oracle-Technologie.

2 Tagen ago

Allianz Risk Barometer 2022: Cyberangriffe weltweites Top-Risiko für Unternehmen

Elfte Umfrage der Allianz: Cyber, Betriebsunterbrechung und Naturkatastrophen sind weltweit die drei größten Geschäftsrisiken in…

3 Tagen ago