- silicon.de - http://www.silicon.de -

Disaster Recovery auf Knopfdruck: Wunsch oder Wirklichkeit?

Zahlreiche Unternehmen legen regulär täglich Backups an und halten diese 30 bis 60 Tage lang vor. Sie verwenden Deduplizierung, um den Bedarf an Speicherplatz und Bandbreite zu reduzieren. Damit haben sie eine Backup-Erfolgsquote von 98 Prozent und fühlen sich dazu fähig, Instant Recoveries, also sofortige Wiederherstellungen, durchzuführen. Bei den meisten internen Backup-Experten liegt ein Disaster-Recovery-Run-Book in einer Kalkulationstabelle vor. In der Kalkulationstabelle werden Informationen wie die Reihenfolge, in der VMs wiederhergestellt werden müssen, die Netzwerkkonfiguration, Firewall-Regeln, DNS-Umleitungsanforderungen und so weiter erfasst.

[caption id="attachment_41636571" align="alignright" width="250"]Thorsten Eckert, der Autor dieses Gastbeitrags für silicon.de,  ist Sales Director DACH bei Actifio (Bild: Actifio) [1] Thorsten Eckert, der Autor dieses Gastbeitrags für silicon.de, ist Sales Director DACH bei Actifio (Bild: Actifio)[/caption]

In Disaster-Recovery-Tests, die je nach Unternehmen mehr oder weniger häufig durchgeführt werden, können oft wie gewünscht auch alle VMs wiederhergestellt werden. In den allermeisten Fällen ist jedoch erhebliche Koordination zwischen dem DR-, Backup-, Storage-, VMware- und Netzwerk-Team erforderlich. Nicht selten dauert es über 12 Stunden, bis der Test tatsächlich gestartet werden kann. In diesem – viel zu langen – Zeitraum ist ein riesiges, funktionsübergreifendes Projektmanagement nötig, um den Job zu erledigen. Die eigentlichen RTO-Ziel (Recovery Time Objective) werden so oft nicht erfüllt.

Typisches Muster zeigt Schwächen auf

Nach Beobachtungen von Actifio [2] wird bei solchen Tests ein Muster deutlich, das bei vielen Unternehmen in Erscheinung tritt:

  1. Instant Recovery ist nicht wirklich skalierbar. Es herrscht die Illusion, dass eine VM schnell wieder eingeschaltet werden kann. Aber in der Realität muss dies in Chargen und mittels Storage vMotion erfolgen.
  2. Es wird viel Zeit für manuelle sequentielle Schritte aufgewendet. Anhand der Tabellenkalkulation wird festgestellt, welche VMs in welcher Reihenfolge wiederhergestellt werden müssen. Zum Beispiel: Die Datenbank-VM muss zuerst wiederhergestellt werden, dann ein Satz von Anwendungsserver-VMs und dann ein Satz von Webserver-VMs.
  3. Weitere manuelle Schritte wie die Zuweisung von IP-Adressen, VLAN-Port-Gruppe und DNS-Server für jede VM benötigen nicht nur Zeit, sondern sind auch fehleranfällig. In der Regel muss eine intensive Fehlersuche stattfinden, falls einige VMs in einem falschen Netzwerk platziert wurden.
  4. Es erfordert eine beträchtliche Anzahl von Mann-Stunden vieler verschiedener Teams, um die DR-Tests durchzuführen. Das alles ist stressig, fehleranfällig und eine Erfahrung, die jeder vergessen will und´von der er hofft, sie nie wieder machen zu müssen.

Um diese Defizite zu beheben, wäre Folgendes erforderlich:

  1. Stressfreies, automatisiertes, zuverlässiges Disaster Recovery auf Knopfdruck oder gleich eine “1-Click”-Disaster-Recovery-Lösung.
  2. Eine Lösung, die sogar einen Schritt weiter geht und geplante, unbeaufsichtigte, vollautomatische Wiederherstellungstests einmal im Monat oder im Quartal selbstständig durchführt.
  3. Eine Lösung, die einen Compliance-Bericht liefert, der wiederholte DR-Tests pro Monat oder Quartal belegt. Dies stärkt das Vertrauen, dass das Produktivsystem tatsächlich innerhalb eines garantierten Zeitrahmens wie etwa vier Stunden wiederhergestellt werden kann.

Welche Disaster-Recovery-Funktionen erforderlich sind

Um diese Ergebnisse zu liefern, gilt es eine Lösung auszusuchen, die über die folgenden Funktionen verfügt:

Plattformen zur Copy-Data-Virtualisierung, liefern die gesamte beschriebene Funktionalität – einfach und skalierbar für Umgebungen mit 100, 300, 500, 1000 und mehr VMs. “1-Klick”-orchestrierte Disaster Recovery kann damit erfüllt werden.

[caption id="attachment_41636574" align="aligncenter" width="684"]Plattformen zur Copy-Data-Virtualisierung liefern die in modernen Rechenzentren erforderliche Funktionalität für Disaster Reovery und DR-Tests. (Grafik: Actifio) [3] Plattformen zur Copy-Data-Virtualisierung liefern die in modernen Rechenzentren erforderliche Funktionalität für Disaster Reovery und DR-Tests. (Grafik: Actifio)[/caption]

Eine solche Plattform zur Virtualisierung von Datenkopien …

  1. bietet Backups mit flexibler Retention für Tage, Wochen, Monate, Jahre oder Jahrzehnte
  2. ermöglicht skalierbare Instant Recovery
  3. bietet „1 Klick“-DR-Orchestrierung mit allen Anforderungen
  4. unterstützt eine flexible RPO von 1 Stunde bis 24 Stunden
  5. bildet die gesamte Funktionalität auf jedem Speicher ab, so dass eine vollständig speicherunabhängige Lösung zur Verfügung steht.
  6. Die Tage, an denen fünf bis zehn Personen an Disaster Recovery or DR-Tests beteiligt sein mussten, sind vorbei. Geplante, automatisierte, unbeaufsichtigte DR-Tests können jeden Monat durchgeführt werden. Diese Tests, die mit Hilfe einer Plattform zur Virtualisierung von Datenkopien effizient und automatisiert durchgeführt werden, bilden die Grundlage dafür, dass im Ernstfall der Re-Start tatsächlich so rasch gelingt, dass der Geschäftsbetrieb nur minimal beeinträchtigt wird.