Exascale-Supercomputer JUPITER setzt Maßstäbe für Energieeffizienz

Bei der Messung für die Green500-Liste der energieeffizientesten Supercomputer erzielte das JEDI-System eine Rechenleistung von 4,5 Billiarden Rechenoperationen pro Sekunde oder 4,5 Petaflops bei einem Stromverbrauch von im Schnitt 66 Kilowatt. Bei einem optimierten Lauf konnte die Leistungsaufnahme auf 52 Kilowatt reduziert werden.

GPUs statt CPUs

Der im April installierte erste Baustein, das „JUPITER Exascale Development Instrument“ oder kurz JEDI, schafft 72 Milliarden Rechenoperationen pro Sekunde pro Watt. Der vorherige Spitzenreiter kam im Vergleich dazu auf rund 65 Milliarden.  Entscheidend für die herausragende Effizienz von JEDI ist der Einsatz von Grafikprozessoren, GPUs, und die Tatsache, dass es gelungen ist, wissenschaftliche Anwendungen für die Berechnung auf Grafikprozessoren zu optimieren. Praktisch alle führenden Systeme der Green500 setzen heute massiv auf GPUs, die Berechnungen bauartbedingt wesentlich energiesparsamer ausführen können als herkömmliche Hauptprozessoren, CPUs.

Hocheffiziente Warmwasserkühlung

Das Entwicklungssystem JEDI gehört zu den ersten Systemen weltweit, die die neueste Beschleuniger-Generation von NVIDIA einsetzen: den NVIDIA GH200 Grace Hopper Superchip, der einen NVIDIA Hopper-Grafikprozessor (GPU) und NVIDIA Grace-Hauptprozessor (CPU) auf einem Chip vereint. Die hocheffiziente Warmwasserkühlung von Eviden, die deutlich weniger Energie benötigt als eine klassische Luftkühlung, leistet ebenfalls einen Beitrag und erlaubt es darüber hinaus die entstehende Wärme im Nachgang weiter zu nutzen.

JUPITER soll als erster Supercomputer in Europa die Marke von einem Exaflops durchbrechen, was einer Trillion – einer „1“ mit 18 Nullen – Rechenoperationen pro Sekunde entspricht. Das finale System wird im zweiten Halbjahr 2024 schrittweise installiert und wissenschaftlichen Anwendern zunächst im Rahmen des Early Access Program zugänglich gemacht, bevor es Anfang 2025 in den allgemeinen Nutzerbetrieb übergeht.

Training von großen KI-Modellen

Die enorme Rechenleistung von JUPITER soll dazu beitragen, die Grenzen wissenschaftlicher Simulationen zu erweitern und große KI-Modelle zu trainieren. Das modular aufgebaute Exascalesystem basiert auf der dynamischen modularen Systemarchitektur (dMSA), die ParTec und das Jülich Supercomputing Centre gemeinsam entwickelt haben. Das derzeit installierte Booster-Modul von JUPITER wird aus 125 BullSequana XH300 Racks und über rund rund 24.000 NVIDIA GH200 Superchips verfügen, die über ein Quantum-2 InfiniBand-Netzwerk miteinander verbunden sind. Bei Berechnungen mit 8 bit, wie sie für das Training von KI-Modellen üblich sind, soll die Rechenleistung auf deutlich mehr als 70 Exaflops steigen. Stand heute wäre JUPITER damit der weltweit schnellste Rechner für KI.

Der Energiebedarf von JUPITER wird nach Schätzungen im Mittel etwa 11 Megawatt betragen. Weitere Maßnahmen sollen dazu beitragen, die Energie noch nachhaltiger zu nutzen. So ist das modulare Rechenzentrum, in dem JUPITER untergebracht wird, darauf ausgelegt, die beim Kühlen anfallende Wärme auszukoppeln und zum Heizen der Gebäude auf dem Campus des Forschungszentrum Jülich zu nutzen.

Roger Homrich

Recent Posts

Bausteine für den verantwortungsvollen Einsatz von KI

Drei Bausteine bilden die Grundlage für eine KI-Governance: Dokumentation von KI-Projekten, Model Evaluation und Monitoring…

21 Stunden ago

Sicheres Identity Proofing im Remote-Betrieb

Eine Harmonisierung der Vorschriften für RIDP-Prozesse wird dazu beitragen, Angriffe künftig besser abwehren zu können,…

21 Stunden ago

Proalpha kauft holländischen ERP-Spezialisten

Die Übernahme der Metaal Kennis Groep soll den Zugang zur Metallindustrie verbessern. Im Fokus stehen…

1 Tag ago

Jobsorgen durch KI: Deutsche eher gelassen

EY hat Mitarbeitende in neun europäischen Ländern dazu befragt, wie stark KI ihren Arbeitsalltag verändert.

2 Tagen ago

DePIN: Ein neues Paradigma für Europas Cloud-Infrastruktur

Kann die Privatwirtschaft mit DePINs – dezentralen, physischen Infrastrukturnetzwerken – erreichen, was Gaia-X bislang vergeblich…

2 Tagen ago

Implementierung und Nutzung entscheidend für MFA-Sicherheit

Analyse zur Anfälligkeit von MFA auf Basis von 15.000 Push-basierten Angriffen. Größte Schwachstelle ist die…

2 Tagen ago