Softwarefehler bei Amazon Web Services

Erst am Wochenende waren Teile des europäischen Cloud-Angebotes von Amazon wegen eines Blitzeinschlag in Irland nicht verfügbar. Jetzt hat ein Softwarefehler dazu geführt, dass Amazon Web Services (AWS) Kundendaten abhanden gekommen sind.

Der Fehler steckt in der Storage-Software des Unternehmens. Amazon arbeitet nach eigenen Angaben mit seinen Kunden an einer Wiederherstellung der verlorenen Daten. Das Unternehmen weist aber darauf hin, dass es dabei zu Inkonsistenzen kommen kann, die möglicherweise wiederum zu Problemen mit Applikationen führen, die auf die Informationen angewiesen sind.

Die ersten Daten waren nach AWS-Angaben schon am Sonntag gelöscht worden. Gestern Nachmittag war das Unternehmen immer noch damit beschäftigt, Informationen, die auf Amazons Elastic Block Storage (EBS) abgelegt waren, wiederherzustellen. Für einige Kunden dauert der Ausfall somit schon drei Tage an.

“Unabhängig von dem Problem mit der Stromversorgung haben wir einen Fehler in der EBS-Software gefunden, die ungenutzte EBS-Snapshots aufräumt”, heißt es auf der Status-Website der Amazon Web Services. “Bei der Ausführung dieser EBS-Software wurden einer oder mehrere Blöcke in einigen EBS-Snapshots fälschlicherweise gelöscht.”

Instanzen von Amazons Cloud-Diensten nutzen EBS normalerweise, um Daten zu speichern. Die Daten befinden sich auf separater Hardware und werden über eine Netzwerkverbindung bereitgestellt. Der Fehler liegt in dem Teil, der als ‘Snapshots’ bezeichnete Abbilder der EBS-Daten verwaltet.

Die Erstellung der benötigten Recovery-Snapshots könne unter Umständen einige Zeit dauern, da “AWS dafür große Datenmengen bewegen und verarbeiten muss”, erklärte Amazon weiter. Die Recovery-Snapshots stellt Amazon über die jeweiligen Kundenkonten zur Verfügung.

Schon in der Vergangenheit war Amazon wegen Elastic Block Storage kritisiert worden. “Amazons EBS ist in Bezug auf Performance und Zuverlässigkeit eine Lachnummer und ein konstantes Problem für Reddit”, sagte ein früherer Reddit-Programmierer im März, nachdem ein Fehler in EBS zu einem Ausfall von Reddit, Quora und anderen Websites geführt hatte.