Dauereinsatz scheint Festplatten nicht zu schaden

EnterpriseNetzwerke

Google sorgt mit einer Untersuchung von handelsüblichen Laufwerken für überraschende Ergebnisse.

Rund 100.000 Festplatten mit Kapazitäten zwischen 80 GB und 400 GB hat das Suchportal seit 2001 im Einsatz. Die Ingenieure verzichten jedoch auf kostspielige Arrays oder andere Storage-Lösungen und verwenden statt dessen konventionelle Laufwerke von der Stange, um Ergebnisse und Web-Seiten zu speichern. Eine selbst geschriebene Software überwacht dabei die Systeme und sammelt im Minutenabstand Informationen. Die Verteilung der Daten auf die einzelnen Festplatten erledigt ein hauseigenes Dateisystem.

Die Ergebnisse hätten selbst die Autoren der Studie überrascht: “Unsere Daten deuten an, dass die Korrelation zwischen Beanspruchung und Häufigkeit von Fehlern weit geringer ist, als andere Untersuchungen zu zeigen scheinen”, heißt es in dem Report. Die Meinung, dass Fehler vor allem in Festplatten auftreten, auf die häufig zugegriffen wird, ist weit verbreitet. Auch die die Google-Ingenieure hätten laut eigenen Angaben mit diesem Ergebnis gerechnet.

Dieses Verhalten hätten jedoch nur sehr neue oder sehr alte Festplatten gezeigt. Von einem Fehler sprechen die drei Autoren der Studie, Eduardo Pinheiro, Wolf-Dietrich Weber und Luiz Andre Barroso dann, wenn die Platte ausgewechselt werden muss. Sie glauben, dass sie die überraschenden Ergebnisse mit Darwins Theorie vom ‘Survial of the Fittest’ erklären können. Anfällige Platten scheiden früh aus und fallen somit aus der Beobachtung heraus. Platten, die diese Selektion überstanden haben, werden erst im hohen Alter wieder anfälliger.

Ein deutlicher Zusammenhang zeige sich jedoch zwischen den Ausfallraten und der Umgebungstemperatur. Demnach fördern niedrige Temperaturen offenbar Fehlfunktionen von Festplatten, während mittlere Betriebstemperaturen keine negativen Effekte haben. Erst wieder bei sehr hohen Temperaturen steige die Fehlerrate wieder leicht an. Platten, die älter als drei Jahre sind, scheinen jedoch hohe Temperaturen weniger gut zu vertragen.

Tritt ein Lese-Fehler in einer Platte auf, liege die Wahrscheinlichkeit, dass der Fehler erneut auftritt, um den Faktor 10 höher. “Nach dem ersten Lesefehler ist die Wahrscheinlichkeit, dass innerhalb der nächsten 60 Tage erneut ein Fehler auftritt, 39 Mal höher”, so die Autoren.