Anzeige

Ausstattung zweier Server-Räume?

Leserfrage: Wir planen zwei getrennte Server-Räume, die durch mehrere Brandabschnitte voneinander separiert sind. Ziel ist, dass ein Server-Raum komplett ausfallen kann, und trotzdem läuft alles weiter. Frage wäre, mit welchen Mitteln lässt sich existierende Hardware zu so einer Lösung mit einbinden bzw. aufrüsten? Oder müsste der zweite Server-Raum identisch ausgestattet sein?

Was wäre bei einem virtuellen Ausweich-RZ via Cloud zu beachten? Halten Sie das für eine sinnvolle Option?

Antwort Doc Storage:

Zunächst einmal ist zu beachten, dass die Trennung zweier Rechenzentren durch lediglich eine brandgeschützte Tür und die entsprechenden Wände im schlimmsten Falle nicht ausreicht. Es ist zu beachten, dass in diesem Worst-Case das gesamte Gebäude betroffen sein wird, also auch beide Räume inklusive Energieversorgung, Klima und Netzwerkinfrastruktur. Wenn Sie also die absolute Gewährleistung brauchen, dass Ihr Betrieb auch im Falle der physikalischen Betroffenheit des gesamten Gebäudes aufrechterhalten wird, werden Sie nicht umhin kommen, den Sekundärbetrieb mindestens in ein anderes Gebäude, im Idealfall aber in einen anderen Standort in einer Entfernung bis zu 100 km einzurichten.

Anzeige

Soll es allerdings aus zwingenden Gründen (kein zweiter Standort vorhanden, begrenztes Budget...) bei einem Gebäude bleiben, ist auf jeden Fall darauf zu achten, dass beide Abschnitte aus getrennten Richtungen von außen mit Strom versorgt und die externen Netzwerkanbindungen ebenso nicht in derselben Richtung aus diesem herausgeführt werden. Im Idealfall wählen Sie auch unterschiedliche Energie- und Netzversorger, um den Ausfall eines dieser Lieferanten abfangen zu können.

Danach wäre eine Klassifikation Ihrer Anwendungen und Daten vonnöten. Was ist überlebensnotwendig, was ist wichtig, und was ist weniger wichtig? Benötigen Sie bestimmte Anwendungen und Daten, um Compliance-Anforderungen zu erfüllen? Haben Sie mit Kunden oder Fachabteilungen Qualitätsvereinbarungen getroffen? Das heißt, müssen bestimmte Anwendungen oder Datenbestände in einem bestimmten Zeitraum wieder »da« sein oder müssen gar unterbrechungsfrei arbeiten?

Kennen Sie Ihre Ressourcen und alle Kosten

Dazu sollten Sie eine Tabelle anlegen, wo Sie in einer weiteren Spalte dann die entsprechenden Hardware-Komponenten (Rechner, Netzwerk, Verkabelung, USV, Klimaanlage usw.) aufführen, die für den Betrieb der jeweiligen Anwendung bzw. die Präsentation der jeweiligen Daten benötigt werden. In der vorletzten Spalte summieren Sie die Kosten für den Betrieb der Hardware, Software und der betreuenden Mannschaft (je nach Dringlichkeit 24x7 oder eben weniger). Die letzte Spalte schließlich unterteilen Sie in drei Unterabschnitte, und fassen hier die Kosten zusammen, die sich erstens für die entsprechende Leistung 1:1 im zweiten Rechenzentrum ergeben (also einen RTO von gegen 0), dann diejenigen, die sich für einen gemeinsamen Betrieb mit anderen Anwendungen auf einer Plattform ergeben, und zuletzt diejenigen, die sich für einen eingeschränkten Betrieb mit längerer, aber noch tolerierbarer RTO ergeben.

Wenn Sie diese Zahlen den jeweiligen Nutzern, also meist den Fachabteilungen präsentieren, werden Sie feststellen, dass kaum eine das Budget für die höchste Leistungsstufe aufzubringen bereit sein wird, nämlich exakt das doppelte für das entsprechende »Service-Level«. Für die meisten wird ein gemeinsamer Betrieb auf weniger leistungsfähigen Plattformen ausreichen, für den dann auch deutlich weniger gezahlt werden muss.

Falls Ihr gesamter RZ-Betrieb ohne Einfluss weiterlaufen soll, das heißt auch mit derselben Leistung und demselben physischen und logischen Datenschutz, benötigen Sie natürlich dieselbe Hard- und Software auf beiden Seiten. Aber dies wird in den allerseltensten Fällen zutreffen.

Cluster halten den Betrieb aufrecht

Eine weitere Möglichkeit wäre die Errichtung von Clustern mit den entsprechenden Speichern über beide Server-Räume. Beide Teile der Rechen- und Speicher-Hardware teilen sich im Normalbetrieb die Arbeit, geschrieben wird von beiden Seiten auf dieselben Laufwerke. Falls nun eine Seite ausfällt, übernimmt die andere den vollständigen Betrieb. Allerdings halbiert sich in diesem Fall die Leistung der Rechner- und Speicherausstattung, und es steht nur noch die Hälfte der Bandbreite zu den Systemen zur Verfügung. Dieser Aufbau hat allerdings den Vorteil, dass über die gesamte Zeit die ganze installierte Hardware genutzt wird und nicht im Standby auf den Ausfall der einen Seite wartet.

Natürlich werden Sie für die Übernahme der Produktion in den anderen Brandabschnitt entsprechende Werkzeuge für Betriebssysteme, Anwendungen, Laufwerke und Netze benötigen. Allerdings wird es kaum nötig sein, die Hardware 1:1 abzubilden und Ihr Budget damit dauerhaft zu belasten. Was Sie darüber hinaus benötigen, sind Werkzeuge zum automatisierten Testen der eingegangenen Service- und Wiederanlaufzeiten. Denn vergessen Sie eines nicht: wenn Ihr Rechenzentrum so »abgeschmiert« ist, dass Sie in ein anderes schwenken müssen, haben Sie keine Zeit mehr, Ihre Verfahren zu testen. Dann müssen Sie sich hundertzehnprozentig auf Ihre Einstellungen verlassen können.

Cloud-Services: Auf das Kleingedruckte achten

Natürlich ist die Nutzung externer Dienstleistungen für Rechner- und Speicherbetrieb, also eine Cloud, heute so technisch ausgereift, dass man diese durchaus in Erwägung ziehen kann. Allerdings müssen Sie auch hier genau auf das Kleingedruckte der Anbieter schauen. Manche rechnen per CPU ab oder per Kern, hinzu kommen die Netzwerkanbindungen und der gewünschte Hauptspeicher. Also diejenige Leistung, die im Rechenzentrum des Dienstleisters abgerufen wird. Manche verkaufen nur ganze Rechner, inklusive einer bestimmten Netzwerkanbindung und einer bestimmten Größe des Hauptspeichers. In den meisten Fällen handelt es sich hier um virtuelle Instanzen, die mit den entsprechenden Einstellungen gestartet und bei Bedarf erweitert werden können. Genauso wird der Massenspeicher behandelt, von der Kapazität über die Schutzstufe bis hin zur jeweiligen Anbindung.

Aber dies ist nur eine Seite der Medaille. Auf der anderen müssen Sie beachten, dass Ihre Anwender im schlimmsten Falle, also bei Totalausfall Ihres Rechenzentrums, über die verfügbare externe Netzwerkanbindung auf die Ressourcen des Dienstleisters zugreifen müssen. Und auch hier tricksen die Anbieter herum, um möglichst viel Umsatz aus Ihnen herauszuholen. Einerseits wird über die Bandbreite abgerechnet, zum zweiten über die durchgeführten I/Os, im schlimmsten Falle allerdings über die Anzahl der geöffneten Dateien. Auch hier müssen Sie intern also ausgiebige Tests an normalen Arbeitstagen durchführen, um einen relativ genauen Eindruck davon zu gewinnen, welche Kosten im schlimmsten Falle auf Sie zukommen.

Darüber hinaus gilt es natürlich auch zu beachten, wie schnell Sie mit Ihren Anwendungen und Daten aus der Umgebung des einen Anbieters heraus- und in diejenige eines neuen, möglicherweise preiswerteren hineinkommen können. Und was Sie das Verlassen der vorherigen Umgebung kostet, denn auch hier können wieder enorme Zusatzkosten anfallen.

Zuletzt ist das Thema Backup und Archiv zu betrachten. Davon ausgehend, dass Sie beides bereits in Ihrem produktiven Rechenzentrum betreiben, bleibt die Frage, ob Sie eine entsprechende Zusatzleistung Ihres Diensteanbieters zukaufen wollen. Denn im Ende ist beim Totalausfall Ihres produktiven Rechenzentrums nicht gewährt, dass die Bandroboter oder was auch immer Sie hierfür bereitgestellt haben noch ihren Dienst tun. Natürlich kann Ihnen jeder Cloud-Betreiber auch Backup und Archiv verkaufen. Auch hier ist wieder die Frage, ob Sie die Tapes im schlimmsten Falle physikalisch zum Transport ausgehändigt bekommen, oder was es kosten wird, deren Inhalte über das Netz zu einem neuen Anbieter zu überspielen. Meist kostet dies weitaus mehr als der eigentliche 24x7-Betrieb, den Sie als Dienstleistung gekauft haben. Der berühmte Eisberg, von dem man nur die Spitze sieht.

Nach meiner Erfahrung mit Cloud-Projekten in produktiven Umfeldern, die ich in den letzten Jahren begleiten musste, kann ich Ihnen nur raten, bei Möglichkeit Ihren Backup-RZ-Betrieb in ein anderes Gebäude auf dem Gelände oder einen anderen entfernten Standort zu verlegen. Hier sind Sie jederzeit Herr über beide Installationen und werden nicht bei einem Totalausfall der Primärumgebung auch noch durch dann anfallende Zusatzforderungen Ihres Dienstanbieters in Verzweiflung getrieben.

Ausfallstandort: Kooperation mit befreundeten Betrieben

Sollte kein zweiter Standort zur Verfügung stehen, empfehle ich, sich mit bekannten anderen Betrieben in Verbindung zu setzen, die vor genau den gleichen Herausforderungen stehen. Viele kleine und mittlere Anwender haben sich schon über die Kreuzverbindung ihrer Sekundärinstallationen geeinigt, so dass der jeweils eine dem anderen seinen zweiten Abschnitt zur Verfügung stellt.

Gruß
Doc Storage

Anzeige