Anzeige

Mit Kompression mehr Daten speichern

Eine effiziente Komprimierung von Daten, insbesondere in einer Produktivumgebung, bedeutet höchste Anforderungen an die eingesetzte Lösung. Kompressions-Technologien von IBM erlauben dagegen eine effiziente und zuverlässige Datensicherung von Produktivdaten.

Marcel Klotz, IBM Deutschland

In vielen Umgebungen, vor allem solchen mit weitgehender Server-Virtualisierung, haben sich Systeme mit integrierter Datendeduplizierung als nicht effizient genug erwiesen. Vor allem bei Verwendung von Snapshots im Primärspeicher, einer in diesem Umfeld sehr beliebten Methode, müssen bei deduplizierten Datenbeständen Dateien vollständig gelesen und abgelegt werden, bevor sie sich in irgendeiner Weise weiterverarbeiten lassen. Dies bedeutet, dass Deduplizierung nur für größtenteils ruhende Daten eine valide Methode der Speicherplatzreduzierung darstellt. Für überwiegend aktive Speicher hat sich in der Praxis die Komprimierung durchgesetzt. Hierbei werden die angeforderten Informationen im Moment der Nutzung blockweise dekomprimiert, zu einer für die jeweilige Anwendung »brauchbaren« Sequenz zusammengefügt und dann dem abrufenden System übermittelt. Die auf dem Datenträger befindlichen Daten bleiben komprimiert, so dass operativ wesentlich weniger Speicherplatz benötigt wird als in deduplizierenden Umgebungen.

Anzeige

Kompression vielversprechender als Deduplizierung

IBM »Storwize V7000«
IBM »Storwize V7000«
Die im »Storwize V7000« und seinem Betriebssystem »SVC V6.4« integrierte Kompression von IBM ermöglicht die Nutzung von bis zu 80 Prozent weniger physikalischem Speicherplatz für dieselbe Menge an Informationen. Vor allem für Datenbanken und E-Mail-Umgebungen lässt sich der installierte Speicher somit wesentlich effizienter nutzen als mit herkömmlichen Arrays, können damit doch bis zum fünffachen der ursprünglichen Datenmenge bei gleicher physikalischer Kapazität angelegt werden. Das IBM-System komprimiert die Informationen in Echtzeit dabei bereits vor dem Ablegen auf der Festplatte, so dass für den Vorgang der Komprimierung kein zusätzlicher Speicherplatz benötigt wird wie beispielsweise bei anderen gängigen Kompressions- und Deduplikationsverfahren.

Durch den Einsatz der neuen Technologie spart der Anwender nicht nur Festplatten und die dafür benötigten Schränke ein, sondern reduziert in Folge auch die für den Betrieb nötige Energie, den Aufwand zur Kühlung und indirekt auch die Kosten für shelfbasierte Software-Modelle. Auch über die Storwize V7000 oder den »SAN Volume Controller« (SVC) extern virtualisierten Speicher (auch Fremdsysteme) lassen sich in das Kompressionsverfahren einbeziehen. Weiterhin wird sofort bereits belegter Speicherplatz wieder freigegeben, so dass sich die Anschaffungs- und Betriebskosten für neue und womöglich größere Systeme zeitlich deutlich nach hinten schieben lassen.

Im Gegensatz zu deduplizierenden Arrays wirkt sich die Komprimierung auch auf den für Snapshots und Repliken benötigten Speicherplatz aus,so dass sich weiteres Volumen freigeben und zusätzlich nutzen lässt. Der größte Vorteil der IBM Storwize V7000 ist allerdings die vollständige Transparenz aller speicherseitigen Vorgänge gegenüber dem Anwender bzw. den verbundenen Systemen. Alle Einrichtungs-, Verwaltungs- und Provisionierungsvorgänge können genauso ablaufen wie gewohnt, so dass die Einführung des neuen Systems schnell und einfach geschehen kann.

Integrierte Storwize-Funktionen

Die Storwize V7000 nutzt dieselbe »RACE« (Random Access Compression Engine), wie sie bereits in den IBM »RTC Appliances« zum Einsatz kommt. Somit handelt es sich hier um eine bereits erprobte und bewährte Technologie, die für virtuelle »Windows«-Umgebungen über 50 Prozent, für virtuelle Linux-Installationen bis zu 70 Prozent und für Datenbanken gar bis zu 80 Prozent Kompressionsraten erzielt. Hierzu wird lediglich die Komprimierungsfunktion im Storwize V7000 über eine Software-Funktion eingeschaltet, die eigentliche Reduzierung und Neuorganisation des Speicherplatzes wird im Hintergrund und völlig transparent durchgeführt. Einzige Voraussetzung hierfür ist das auch im SVC verwendete Betriebssystem in der Version V6.4, in dem die beschriebene Funktionalität enthalten ist.

Im Gegensatz zu anderen Lösungen im Markt kann die IBM-Methode zur Datenkomprimierung für alle Arten von Daten (sofern nicht anderweitig komprimiert), auch solche in aktiven Primärumgebungen eingesetzt werden. Somit muss der Anwender im Vorfeld keine umständliche Qualifikation seiner Informationsbestände vornehmen, um das beste Ergebnis zu erzielen bzw. seine Produktion nicht zu beeinflussen. Vor Aktivierung der Komprimierung empfiehlt sich zudem der Einsatz des Comprestimator-Tools zu Feststellung der erreichbaren Kompressions-Rate. Das Tool kann kostenfrei auf der IBM-Webseite bezogen werden.

Kompression ist nicht gleich Kompression

Im Gegensatz zu traditionellen Ansätzen in der Komprimierung muss zur Änderung von kleinen Abschnitten in großen Dateien nicht die gesamte Datei geladen, dekomprimiert, geändert und wieder geschrieben werden. Ein Beispiel: Soll in einer Datei von einem MByte Größe ein Abschnitt von nur 100 Byte geändert werden, muss eine herkömmliche Komprimierungsanwendung die gesamte Datei - also ein MByte - lesen, dekomprimieren, die 100 Byte an einer bestimmten Stelle ändern, die Datei komprimieren und wieder schreiben. So ergeben sich mindestens 2,1 MByte Datentransfer von und zur Festplatte und I/Os für mindestens 4,1 MByte im Speicher, und das für lediglich 100 Byte Änderung. Die IBM-Lösung fügt die Änderungen direkt und bereits komprimiert in die auf Platte geschriebenen Informationen ein, so dass sich tatsächlich nur deutlich weniger als 100 Byte als Transfer zur Platte ergeben.

Mit diesem wesentlich effizienteren Verfahren lässt sich nicht nur eine bis zu fünffache Komprimierung der Daten in Echtzeit realisieren, währenddessen können die Verarbeitungszeiten beibehalten oder – unter bestimmten Voraussetzungen – sogar verbessert werden. Tests im Datenbankumfeld mit demselben Speichersystem haben Verbesserungen auf unter 50 Prozent der ursprünglichen Antwortzeiten mit eingeschalteter Kompression ergeben. In virtualisierten Umgebungen bleiben die bisherigen Antwortzeiten bei gleichzeitiger vierfacher Kompressionsrate gleich.

Im Vergleich zu herkömmlichen Kompressionsmethoden beeinflusst die Storwize V7000 also den Produktivbetrieb lediglich, indem sie in vielen Umfeldern die Antwortzeiten reduziert. Und das bei bis zu fünffach besserer Nutzung des vorhandenen physikalischen Speicherplatzes.

Kompression schafft Einsparungspotenziale

Jeder Kunde, der bereits über eine Storwize V7000 oder einen SVC der letzten beiden Generationen verfügt, kann die Software in der Version 6.4 laden und die darin enthaltene Echtzeit-Komprimierungsfunktion über die grafische Benutzeroberfläche einfach einschalten und 45 Tage kostenfrei testen. Innerhalb der Testperiode kann sich der Anwender dann von den entsprechenden Einsparungen bei Speicherplatz, Hardware, Standplatz, Energie und Klima überzeugen sowie Erfahrungen mit der Umgebung sammeln. Innerhalb des Testzeitraumes lässt sich das Produkt durch Erwerb einer entsprechenden Lizenz freischalten oder die Funktion außer Kraft setzen, die komprimierten Daten in den ursprünglichen Zustand zurückversetzen und die Speicherumgebung ohne Kompression weiterbetreiben.

Die Lizensierung für die Komprimierungsfunktion erfolgt pro Drawer zu jeweils 24 Platten. In einem V7000-System mit ursprünglich 96 Platten, also vier Drawern, spart der Anwender bei einer Kompressionsrate von 25 Prozent also einen Drawer mit 24 Platten.

Trotz der zusätzlichen Lizenzkosten für die Komprimierung sparen Unternehmen zirka ein Drittel an Hardware-Anschaffungen im Vergleich zu den ursprünglichen Gesamtkosten. Ist bereits ein System im Betrieb, lassen sich Kapazitätserweiterungen durch die Neuanschaffung von Erweiterungseinheiten und Platten abhängig von der Kompressions-Rate deutlich hinauszuzögern.

Natürlich sind dabei immer die Datenbestände und IT-Gegebenheiten ein ausschlaggebender Faktor, mit dem das Einsparpotential steigt und fällt. Generell lässt sich aber sagen, dass die IBM-Technologie in jedem Falle Effizienz und Investitionsschutz gerade bei Datenbank-Umfeldern und virtuellen Welten bringt.

Weitere Informationen
IBM Deutschland GmbH
D-71139 Ehningen
Tel. +49 (0) 800/784 39 77

Anzeige