Anzeige

Was bedeutet Silent-Data-Corruption / Bit-Rot?

Leserfrage: In einer der größeren PC-Zeitungen stand zu lesen, dass die aktuell gültigen RAID-Level für die großen Mengen an TByte eigentlich nicht mehr ausreichen. Sie schützen zwar vor Datenverlust, beim Ausfall von einer oder zwei Platten, doch nicht vor »Silent Data Corruption« oder »Bit Rot«. Können Sie dies näher erklären? In teuren Enterprise-Systemen gibt es diverse Schutzmechanismen. Wie verhält es sich aber in günstigen Standard-Arrays für den Mittelstand oder in NAS-Server für den SoHo-Einsatz?

Anzeige

Antwort Doc Storage:

Silent-Data-Corruption oder manchmal auch passender Bit-Rot wird die unerkannte Verfälschung von Informationen innerhalb von Dateien genannt. Das Phänomen kann annähernd alle modernen Dateisysteme befallen. Dies tritt umso häufiger auf, je größer die Datenmengen sind und je häufiger in diese geschrieben wird und ist somit noch weit vor technischen oder Sicherheits-Problemen die Nemesis im Speicherbereich. Selbst aktuelle RAID-Systeme kümmern sich lediglich beim Schreibvorgang um die korrekte Ablage der Informationen, lassen diese dann jedoch mehr oder weniger unbeachtet. Kippt dann auch nur ein Bit innerhalb einer Datei, kann diese für immer unlesbar sein. Als häufigste Fehlerursache ist hierbei die Veränderung von Prüfsummen zu nennen, deren Behebung meist nur durch eine erzwungene Wiederherstellung einer RAID-Gruppe möglich ist.

Studien auf diesem Gebiet zeigen, dass passiv veränderte Dateien in einer von ungefähr 1.500 Dateien auftauchen. Wieder andere geben eine Zahl von rund zehn Prozent aller logischen Laufwerke an, die mit diesem Problem zu kämpfen haben. Dabei sind die Ursachen der unfreiwilligen Veränderung in den meisten Fällen eher trivial. Mal greifen unterschiedliche Software-Versionen auf dieselbe Datei zu, mal sind fehlerhafte Controller oder andere Komponenten verantwortlich. Und die bislang genutzten Prüfsummen mit einer Größe von acht Bit im selben Block können Bit-Rot zwar erkennen, sind jedoch bei anderen Phänomenen wie Software-Fehlern, falschen Schreibvorgängen oder externen Paritätsfehlern machtlos. Der übliche Aufbau einer Speicherarchitektur mit RAID-Gruppe, LUN und Dateisystem führt in diese Gleichung nochmals drei weitere Faktoren ein, die für ungewollte Veränderungen verantwortlich sein können und alle nichts von den Aktivitäten des anderen wissen oder deren Fehler korrigieren können.

Als einziges ganzheitliches Mittel gegen diese Gefahren steht momentan ZFS zur Verfügung, welches alle Hierarchien der Speicherwelt integriert abdecken kann. Die Prüfsummen werden in einem Merkle-Baum abgelegt und können somit auf allen Ebenen konsistent gehalten werden. Diese Vorgehensweise verhindert nicht nur Bit-Rot, sondern wendet auch alle anderen Gefahren durch externe Strahlung, Erschütterung und allen anderen möglichen Gefahren ab.

Heute gibt es im Markt immer mehr kleine und mittlere Speichersysteme, die die Daten intern mit ZFS schützen. Diese Arrays sind momentan der einzige Weg, um Ihre Informationen nachhaltig vor den beschriebenen Gefahren zu schützen

Gruß
Doc Storage