EMC: Neue Hardware für die Data Lake Foundation

EMCs Lösung für den Data-Lake. (Bild: EMC)

Mit einem neuen Vertreter der Isilon-Familie sowie neuer Software will der Storage-Anbieter EMC den Aufbau von Data-Lake-Speicherinfrastrukturen vereinfachen.

Die Storage-Appliance ECS unterstützt die Data Lake Foundation. (Bild: EMC)
Die Storage Appliance ECS richtet sich an regional verteile Infrastrukturen und unterstützt ebenfalls die Data Lake Foundation. (Bild: EMC)


EMC stellt neue Hardware und neue Software für den Aufbau so genannter Data Lake Speicherumgebungen vor. Die EMC Data Lake Foundation liefert eine konsolidierte Speicherinfrastruktur, bei der strukturierte oder unstrukturierte Rohdaten aus unterschiedlichen Quellen gespeichert werden. Anwender können damit Storages-Silos abbauen und auch den Speicherbedarf senken.

Eine zentrale Komponente ist die NAS-Speicherplattform Isilon HD400. Diese steigert die Kapazität des Vorgängermodells um den Faktor 2,5. So kann ein Anwender pro Rack 3,2 Petabyte Kapazität vorhalten. Für Datenschutz und Datenverfügbarkeit sorgen neue Data-Protection-Optionen sowie verbesserte Protection Policies, Auditing-Möglichkeiten und Authentifizierungsfunktionen.

Zudem unterstützt die neue Version 7.2 des Betriebssystems OneFS Hadoop 2.3 und 2.4 sowie OpenStack Swift. Auch Hortonworks-Hadoop ist jetzt für die Plattform zertifiziert.

“Uns geht es weniger darum, eine neue Storage-Konsolidierung voranzutreiben, sondern wir verfolgen damit die Strategie, mit der Data Lake Foundation ein Fundament für die übergeordnete Business-Data-Lake-Architektur anzubieten”, erklärt Norbert Funke, EMEA Sr. Product Marketing Manager von EMC Isilon. Damit vereine EMC Datenspeicher, Anwendungen und Analysewerkzeuge in einen Pool.

(Bild: EMC)
Isilon HD400 verbessert die Leistung des Vorgängers um den Faktor 2,5. In einem Rack lassen sich maximal 3,2 Petabyte abbilden. (Bild: EMC)

Wie Funke erklärt, bietet das mehrere Vorteile. So können Anwendungen oder auch Nutzer auf die Daten – die nur einmal abgelegt werden müssen –  zugreifen und diese am Speicherort auswerten. Zudem ist, wie IDC in einem Whitepaper nachweist, die Performance der Data-Lake-Foundation besser als mit Direct Attached Storage (DAS). Das, so Funke, habe vor allem damit zu tun, dass die Datensilos einer DAS-Architektur aufgebrochen sind und damit Abfragen schneller sind.

Das EMC OneFS unterstützt mehrere Protokolle und damit auch verschiedene Nutzungsszenarien. (Bild: EMC)
Das EMC OneFS unterstützt mehrere Protokolle und damit auch verschiedene Nutzungsszenarien. (Bild: EMC)

Daneben sind auch weitere neue Softwarefunktionen für die Data Lake Foundation für die Leistungssteigerung verantwortlich. Das Isilon-Betriebssystem OneFS 7.2 integriert jetzt das leistungsfähige Hadoop-Dateisystem zur Speicherung sehr großer Datenmengen in den Versionen HDFS 2.3 und 2.4. Dank Hadoop-Support können Datei-, Objekt- und Hadoop-Arbeitslasten gleichzeitig und auf Grundlage des gleichen Datensatzes abgearbeitet werden.

Bisher hatte die EMC Data Lake Foundation sich auf die Distributionen von Cloudera und Pivotal beschränkt. Dank der Zusammenarbeit mit Hortonworks können Anwender nun auch Apache Ambari zur Verwaltung, Überwachung und Bereitstellung von Hadoop-Clustern auf Isilon-Datenspeichern einsetzen.

Die Data Lake Foundation ist ebenfalls auf der Elastic Cloud Storage (ECS) Appliance verfügbar. Mit der hyperskalierbare Objektspeicherplattform ECS Appliance richtet sich EMC an die Verwaltung von geografisch verteilten Umgebung als logische Ressource. ECS bietet universelle Zugriffsmöglichkeiten mit Unterstützung für Block-, Objekt- und HDFS-Daten (Hadoop File System).

Zudem stellt Funke noch für dieses Jahr weitere neue Produkte für den Data Lake in Aussicht.