SAS erweitert Analytics mit Big Data

Mit neuen Features verbindet SAS Institute den High-Performance Analytic Server mit so genannten Big Data Technologien wie Hadoop oder HDFS.

Dadurch lasse sich die Analytic-Technologie von SAS leichter dafür nutzen, um Daten zu analysieren, die in Hadoop-Umgebungen gespeichert sind. Dafür unterstützt es jetzt Hadoop und das Hadoop Distributed File System (HDFS). Darüber hinaus lassen sich über die neuen SAS-Funktionen auch andere Datenquellen einfacher als bisher in die Analyse einbeziehen lassen. Wie das Unternehmen mitteilt, können über den Analytic Server auch über eine grafische Oberfläche Befehle für Pig, Hive, MapReduce und HDFS abgeben werden.

Der SAS Analytic Server ist seit etwa einem Jahr verfügbar und richtet sich darauf, mehrere Terabyte große Datensätze zu analysieren und zu visualisieren. Über Technologien wie In-Memory oder In-Database-Analytics kann die Software, die derzeit für Datenbank-Appliances von Teradata und Greenplum verfügbar ist, diese Daten sehr schnell prozessieren.

Mit der aktualisierten Version seien, wie der Hersteller bei einer Veranstaltung in Las Vegas erklärte, die Anwender in der Lage unstrukturierte wie auch strukturierte Daten in großen Mengen direkt aus den Hadoop-Umgebungen zu laden und im High Performance Analytic Server zu analysieren.

Doch über das SAS/Access Interface für Hadoop können Daten nicht nur geladen werden, sondern auch geschrieben und gepflegt werden. Für den Anwender sehen die Hadoop-Daten dann aus wie native Daten aus dem Analytic Server. Das bedeute, dass der Anwender keine datenbankspezifische Sprache zwischenschalten muss, um diese Informationen zu analysieren oder sie mit anderen Daten zu vergleichen.

Daneben stellte SAS auch eine neue Version des Text Minter vor, mit der sich Informationen aus sozialen Netzen, Blogs, Nachrichten oder auch Callcentern auswerten lassen. Neu sind hier statistische Methoden und ein linguistisches Regelwerk, das die Auswertung von solch unstrukturierten Texten deutlich vereinfache und leistungsfähiger mache.

Für das Thema Event-Processing hat SAS die DataFlux Event Stream Processing Engine vorgestellt. Damit können Unternehmen Daten-Streams – etwa aus Online-Tools, oder Daten-Feeds auswerten. Diese können dann zum Beispiel für die Betrugsbekämpfung bei Kreditkarten oder für die Optimierung von Werbekampagnen verwendet werden.