Universität Bonn rettet Daten nach Stromausfall

Automatisches FailOver verhindert Datenverlust und Ausfallzeiten nach Versagen der Klimaanlage im Rechenzentrum der Universität.

Die Universität Bonn hat dank einer Datensicherungslösung einen massiven Ausfall seiner IT-Systeme vermieden. Die Lösung zur sicheren Verwaltung von Geschäftsanwendungen, Systemen und Daten hat einen Stromausfall in einem der Rechenzentren der Universität erkannt und ein automatisches FailOver in ein zweites Rechenzentrum eingeleitet. Die Ausfallsicherung ProLion sorgte dafür, dass die IT-Systeme der Universität weiterliefen, und verhinderte Datenbeschädigungen und -verluste in großem Umfang.

Temperaturanstieg führt zum Stromausfall

Der Stromausfall ereignete sich an einem Sonntag im Frühjahr 2022 und führte dazu, dass die Klimaanlage in einem der Rechenzentren der Universität Bonn unbemerkt ausfiel. Die Temperatur im Rechenzentrum stieg in kurzer Zeit auf ein kritisches Niveau, sodass die Stromversorgung des Rechenzentrums ausfiel und sich auf die NetApp MetroCluster-Server auswirkte. Normalerweise muss bei einem Ausfall in einem Rechenzentrum mit MetroCluster sofort ein SwitchOver eingeleitet werden, um die Server und Systeme am Laufen zu halten. Ohne diese Umschaltung sind die Server nicht mehr verfügbar.

Doch selbst bei synchroner Datenspiegelung gibt es keine Garantie dafür, dass eine solche automatische Umschaltung das so genannte “Split Brain Problem” nach einem Neustart verhindert. Das Split Brain Problem tritt auf, wenn eine Gruppe von Speicherknoten in kleinere Cluster von Knoten aufgeteilt wird, von denen jeder glaubt, er sei der einzige aktive Cluster. Dies kann häufig zur Beschädigung oder zum Verlust von Daten führen. ClusterLion löst diese Herausforderung, da die Lösung völlig unabhängig von der IT-Infrastruktur ist und so sicherstellt, dass alle Systeme “Always-On” bleiben – ohne jegliche Ausfallzeiten.

Automatisches FailOver

An der Universität Bonn verhinderte die ClusterLion-Lösung den kompletten Systemausfall, indem sie den Stromausfall sofort erkannte und innerhalb weniger Sekunden ein automatisches FailOver auf ein zweites Rechenzentrum einleitete. Dadurch blieben alle Daten und Dienste online und die Mitarbeiter und Studenten der Universität konnten das Netzwerk ohne Unterbrechung weiter nutzen. Nachdem die Klimaanlage repariert war, wurden alle Systeme im betroffenen Rechenzentrum neu gestartet. “Massive Ausfallzeiten, Wiederherstellungsarbeiten, Datenverlust und damit auch zahlreiche Überstunden des Storage-Teams vermieden werden”, sagt Alexander Meyer, Systemintegrationsspezialist an der Universität Bonn, kommentiert den Vorfall: 

“Wie dieser Vorfall zeigt, sind Cyberangriffe nicht die einzige Bedrohung, auf die sich Unternehmen vorbereiten müssen”, warnt Robert Graf, CEO von ProLion. “Stromausfälle, die durch Phänomene wie Hitzewellen, Überschwemmungen oder Stromausfälle verursacht werden, sind ebenfalls Risiken, die zu Systemausfällen führen können.”