Big-Data-Speicherlösung: Forschungszentrum DESY und IBM kooperieren

IBM Logo (Bild: IBM)

Bis zu 20 GByte pro Sekunde soll das System verarbeiten können. Dadurch will DESY Daten schneller für die Forschung bereitstellen. Eine neue Generation von Software Defined Storage bildet die Grundlage der Lösung. Diese wird von IBM unter dem Codenamen Elastic Storage entwickelt.

Gemeinsam entwickeln das Forschungszentrum DESY und IBM eine Big-Data-Speicherlösung, mit der wissenschaftliche Daten schneller ausgewertet werden können. Bis zu 20 GByte pro Sekunde soll es verarbeiten können. Das entspricht dem Inhalt von fünf einfachen DVDs.

ibm-logo2000 Mitarbeiter betreiben am Deutschen Elektronen-Synchrotron DESY naturwissenschaftliche Grundlagenforschung. Es finanziert sich aus öffentlichen Mitteln und ist Teil der Helmholtz-Gemeinschaft. Die Namensgebung geht auf den Bau des ersten Teilchenbeschleunigers DESY zurück, der 1960 begann. Das Zentrum hat seitdem weitere Ringbeschleuniger gebaut.

DESYs Forschungslichtquelle Petra III soll beispielsweise einzigartige Einblicke in den Nanokosmos ermöglichen. Dafür verwendet es höchst brillantes Röntgenlicht. Der Ringbeschleuniger ist 2,3 Kilometer lang und schickt elektrisch geladene Teilchen mit nahezu Lichtgeschwindigkeit durch magnetische Slalomstrecken, um intensive Röntgenstrahlung zu erzeugen. Erkunden die Forscher mit diesem Licht atomgenau die innere Struktur von Proben, entstehen dabei riesige Datenmengen.

“Ein typischer Detektor liefert heute einen Datenstrom von etwa fünf Gigabit pro Sekunde”, erklärt Volker Gülzow, Leiter der DESY-IT. “An Petra III steht aber nicht nur ein Detektor, sondern es gibt 14 Messstationen, die zur Zeit auf 24 erweitert werden. Alle diese Daten müssen zuverlässig gespeichert und verarbeitet werden.”

Für dieses Problem arbeiten DESY und IBM Research an einer Lösung. Sie basiert auf einer neuen Generation von Software Defined Storage. IBM hat sie unter dem Codenamen Elastic Storage entwickelt. Diese Technologie soll ermöglichen, 10 Milliarden Dateien auf einem System innerhalb von 43 Minuten zu scannen, Daten durch Virtualisierung zu sammeln und Flash in Servern zu nutzen. Die zugrunde liegende Technik stammt dem Hersteller zufolge aus dem Supercomputer Watson. Dieser hatte bei der US-Quizshow Jeopardy gegen menschliche Gegner gewonnen. IBM versucht fieberhaft ihn zu kommerzialisieren.

Die gemeinsam erarbeitete Lösung soll bis zu 20 GByte Daten, die pro Sekunde an den Messstationen von Petra III erzeugt werden, speichern und für die Analyse vorhalten. Damit könnten die Forscher wesentlich schnelleren Zugang zu den Messdaten bekommen. DESY will auf diese Weise Analysis-as-a-Service sowie Cloud-Dienste für die Nutzer seiner Anlagen aus aller Welt anbieten.

Als skalierbares System soll es auch künftige Herausforderungen meistern. Mit internationalen Partnern baut DESY den europäischen Röntgenlaser European XFEL und damit eine Forschungslichtquelle, die noch wesentlich mehr Daten liefern wird. “Wir erwarten vom European XFEL etwa 100 Petabyte pro Jahr, also 100 Millionen Gigabyte”, erläutert Gülzow. Das wäre vergleichbar mit dem Datenvolumen des bisher weltgrößten Teilchenbeschleunigers Large Hadron Collider (LHC) am Europäischen Kernforschungszentrum CERN bei Genf.

“IBM kann von den Erfahrungen mit DESY profitieren und diese in andere datenintensive wissenschaftliche Bereiche wie etwa Astronomie, Klimaforschung und Geophysik einbringen”, hofft Jamie Thomas, General Manager Storage and Software Defined Systems bei IBM. “Dort können dann ebenfalls Speichersysteme errichtet werden für die Analyse von Daten, welche von verteilten Detektoren und Sensoren erzeugt worden sind.“

[mit Material von Bernd Kling, ZDNet.de]

Tipp: Wie gut kennen Sie sich mit der europäischen Technologie-Geschichte aus? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.