Anzeige

Was ist eine Quorum-Device?

Leserfrage: Bei einer Diskussion über Cluster und Replizierung wurde der Begriff Quorum-Laufwerk erwähnt. Alle haben brav genickt, bin mir aber sicher, dass es eigentlich keiner erklären könnte. Daher, was ist ein Quorum-Device und wozu dient es? Welche Nachteile hat ein Quorum, vor allem auch aus Hochverfügbarkeitssicht?

Antwort Doc Storage:

Ein Quorum-Laufwerk dient in Clustern zur Aufrechterhaltung der Datenintegrität. Bei Ausfall eines Clusters, der aus zwei oder mehr Knoten mit angehängten Laufwerken aufgebaut ist, besteht die latente Gefahr asymmetrisch geschriebener Daten (split brain). Dies bedeutet, dass entweder bei Ausfall der Netzwerkkommunikation zwischen einzelnen Standorten oder dem Ausfall einer Seite des Clusters die noch laufenden Anwendungen in die noch ansprechbaren Laufwerke schreiben.

Anzeige

Da diese nicht mehr in ihre replizierten Gegenparts auf der anderen Cluster-Seite gespiegelt werden, entsteht eine Asymmetrie. Weniger schlimm ist dies beim Ausfall einer kompletten Seite – in diesem Fall muss nach Wiederherstellung der Verbindung die zwischenzeitlich noch aktive Seite lediglich in die dann wieder verfügbare repliziert werden. Viel katastrophaler ist der Ausfall der Kommunikation zwischen beiden Seiten. In diesem Fall schreiben die Anwendungen auf beiden Seiten in die für sie noch sichtbaren Laufwerke und erzeugen mit der Zeit eine immer größere Asymmetrie. Wird die Kommunikation wieder hergestellt, muss eine Instanz darüber entscheiden, auf welcher Seite die Daten nach der Wiederherstellung des regulären Betriebes »gewinnen«.

Dabei spielt das Quorum-Laufwerk eine im Wortsinne entscheidende Rolle, liegt diese doch auf beiderseitig auch bei Ausfall erreichbarem Speicher (shared disk). Auf Basis der hier festgehaltenen Daten kann nach Wiederherstellung des regulären Betriebes schnell entschieden werden, wessen Daten »gewinnen« und somit für den weiteren Betrieb genutzt werden. Der Admin kann vorgeben, ob beispielsweise die Seite mit der höheren I/O-Belastung oder die Seite mit der größeren Anzahl noch funktionstüchtiger Knoten verwendet wird. Ohne eine solche beiderseitig noch erreichbare Platte wäre eine solche Entscheidung nach dem Wiederanlauf schier unmöglich.

Gruß
Doc Storage

Anzeige