Häufige Fehler im Umgang mit RAID-Systemen

Die Wiederherstellung von Daten aus zerstörten RAID-Verbänden entwickelt sich immer mehr zu einem Schwerpunkt der Arbeit von CBL Datenrettung.

Der Forensic-Dienstleister hat dabei eine Reihe wiederkehrender Ursachen für den Datenverlust festgestellt und gibt Tipps zu dessen Vermeidung.

RAIDs, vor allem mit RAID Level 5, seien als ausfallsichere Server sehr beliebt, hieß es von CBL Datenrettung. Bekanntlich könne bei einem RAID 5 eine Festplatte ausfallen, ohne dass Daten verloren gehen. Die Erfahrung zeige aber, wie trügerisch diese Sicherheit sei. Meist sei es die Kombination aus physikalischen Auslösern und Anwenderfehlern, die zum Verlust von Daten führt.

“RAID-Datenwiederherstellung gehört zu den komplexeren Aufgaben unserer Branche”, sagte Gerlinde Wolf, Channelmanager bei CBL Datenrettung. “Wir bemühen uns, so gut wie möglich zu verstehen, wie es zu einem Datenverlust kommen konnte und befragen die Kunden entsprechend. Interessanterweise wird als Auslöser für die Probleme mit RAIDs häufig ein Stromausfall genannt.”

Stromausfall führe auf Windows-basierenden RAIDs indirekt zu Problemen. Wenn man nach dem Reboot das Windows-Hilfsprogramm Checkdisk durchlaufen lasse, könne dieses, da es keine RAIDs erkennt, Änderungen auf den beteiligten Platten durchführen, die die RAID-Datenmuster zerstören. Auch die versehentlich angestoßene RAID-Initialisierung sei ein “beliebter Fehler” nach einem unerwarteten Ausfall des Servers. Dabei werden im Extremfall alle Daten überschrieben.

Trotz der Redundanz in einem RAID 5 könne auch der Ausfall einer Platte letztlich zu Datenverlust führen. Zum einen werde der Ausfall einer Platte oft nicht bemerkt, bis dann eine zweite ausfällt. Monitoringfunktionen sollten deshalb auf jeden Fall angewendet und beachtet werden. Zum anderen sei ein ‘degraded RAID’, in dem bereits eine Platte ausgefallen ist, bis zum abgeschlossenen Wiederaufbau besonders verletzlich. Wird der ‘Rebuild’ durch äußere Einflüsse unterbrochen, sei das RAID zerstört. Hier könne ein Stromausfall direkt den Datenverlust verursachen.

Ist das RAID aus normalen PC-Festplatten aufgebaut, die nicht für Dauerbetrieb ausgelegt sind, ergebe sich während eines Rebuild eine besondere Belastung für die verbliebenen Platten. Die über Stunden gehenden Schreib-Lese-Aktivitäten könnten leicht zu einer Überhitzung führen und den Ausfall einer zweiten Platte provozieren. Es biete sich daher an, vor dem Rebuild die Platten zu spiegeln.

Ein häufiger Fehler sei darüber hinaus, dass die Hotspare-Ersatzplatte als Teil des RAID mitgezählt und das RAID mit der falschen Zahl an Platten wiederaufgebaut wird. Auch eine geänderte Reihenfolge der Platten könne die Konfiguration zerstören. “RAIDs sollten niemals die einzige Datensicherung eines Unternehmens darstellen, eine zweite Sicherungsebene ist empfehlenswert”, sagte Wolf.