Big Data: TIBCO integriert Visual Analytics mit Spark

Daten aus Apache Hadoop können flexibel und bruchfrei exploriert, analysiert und visualisiert werden. TIBCO Spotfire ist die erste kommerzielle Lösung, die sich mit Apache Spark integriert.

TIBCO Software integriert die BI-Lösung Spotfire mit Apache Spark und liefert damit die laut eigenen Angaben branchenweit erste kommerzielle Integration mit Spark. Diese Integration übernimmt ein Konnektor der die Lösung direkt mit Spark SQL verbindet. Die Engine-Ebene verfügt darüber hinaus noch über eine Einbettung in SparkR.

Damit bekommen neben Datenwissenschaftlern nun auch Geschäftsanwender die Möglichkeit, mit Apache Hadoop erzeugte Daten flexibel, nahtlos ohne großen technischen Aufwand zu explorieren, zu analysieren und zu visualisieren. TIBCO bietet gemeinsam mit Databricks, dem Unternehmen hinter dem Open Source Projekt Spark, eine Integration von Spark und der TIBCO-Technologie Jaspersoft. Damit kann TIBCO Analytics eine Lösung für Datenexploration, -analyse und –reporting anbieten, über die sich in der gesamten Analytics-Umgebung des Unternehmens Analysen erstellen und einbetten lassen.

“Mit dem schnellen, intuitiven Direktzugriff auf Apache Spark-Datenquellen schließen wir die Kluft, die Big Data und Data Discovery bisher voneinander getrennt hat”, so Brian Gentile, SVP & GM von TIBCO Analytics. Durch die Spark-Unterstützung und der SparkR-Integration von Spotfire können Anwender schnell Hadoop-Daten auswerten. Dadurch werde die Analyse von Hadoop-Daten nicht nur für Datenexperten interessant, sondern auch für weniger versierte Anwender.

TIBCO integriert die kommerzielle Lösung Spotfire mit Hadoop und Spark sowie SparkR. (Bild: TIBCO)
TIBCO integriert die kommerzielle Lösung Spotfire mit Hadoop und Spark SQL sowie SparkR. (Bild: TIBCO)

Anwender von Spotfire können Big-Data-Visualisierungen mit Spark SQL ergänzen und damit Spark etwa mit prädiktiven, Geodaten- und Event-gestützten Analysefunktionen kombinieren. “Spotfire-Anwender können SparkR nun über die hochperformante TIBCO Enterprise Runtime for R (TERR)-Engine nutzen, die in Spotfire und andere TIBCO-Produkte ebenfalls eingebettet ist”, ergänzt Michael O’Connell, Chief Data Scientist von TIBCO. Somit können Business-Analysten und andre Anwender aus der Spotfire-Oberfläche heraus über Spark anspruchsvolle Big Data-Analysen durchführen. Auch die Templates aus Spotfire lassen sich für Spark-Analysen verwenden. Dank der Verbindung von SparkR und TERR könnten auch in vorhandenen Spark-Clustern umfangreichere und komplexere Analyseaufgaben bewältigt werden.

“Die direkte Kopplung von Spotfire Cloud mit Apache Spark SQL ist ein deutliches Zeichen dafür, dass das Apache Spark Framework immer wichtiger wird”, kommentiert Kavitha Mariappan, VP Marketing von Databricks. “Die Integration des TIBCO Spark SQL-Konnektors in die Spotfire Cloud-Analysesoftware wird dazu führen, dass mehr Business-Analysten als bisher ihre Spark-Daten visualisieren.”

Der Spark SQL-Konnektor ist ab sofort in TIBCO Spotfire Cloud verfügbar. In TIBCO Spotfire werde der Konnektor mit dem nächsten Release integriert werden. Unter http://spotfire.tibco.com steht eine Testversion von Spotfire Cloud zum Download bereit. Angaben zu unterstützten Spark-Treibern gibt es hier http://support.spotfire.com/sr_spotfire_dataconnectors.asp#apachesparksql.