Tiered Storage bringt den Erfolg
Unternehmen entwickeln sich zunehmend zu Daten-Messis. Seit Jahren erzählt man ihnen, dass sie auf einem digitalen Goldtopf sitzen: ihren Daten. In Folge der Sensibilisierung für die Bedeutung ihrer Daten löschen sie diese nur sehr selten. Datenvolumina im PByte-Bereich sind keine Seltenheit mehr – entsprechend benötigen Unternehmen ausgefeilte Speicher- und Archivierungsstrategien. Die Lösung lautet Tiered Storage.
Stéphane Estevez, Quantum
Das Tiered-Storage-Portfolio von Quantum besteht aus Hybrid-Storage, Deduplizierungs-Appliances, Object-Storage und Tape-Lösungen (Bild: Quantum).Als vor wenigen Jahren die ersten externen Festplatten für den Heimgebrauch mit TByte-Speicher auf den Markt kamen, dachten viele: »Wie soll ich jemals so viele Daten zusammenbekommen?« Kurze Zeit später fragten die ersten nach einer 2-TByte Festplatte. Zentrale Server zu Hause, remote Speichermöglichkeiten und die Cloud in ihren unterschiedlichen Erscheinungsformen haben unsere Denkweise bezüglich Datensicherung geändert. Daten werden nur selten gelöscht, durch die Aufbewahrung an mehreren Orten gleichzeitig sichern wir uns für alle Eventualitäten ab – zusätzlich möchten wir auch von überall aus darauf zugreifen können.
Laut einer IDC Studie von April 2014 machen unstrukturierte Dateien wie Videos, Bilder, Entwürfe und Aufzeichnungen 80 Prozent des Datenwachstums bei Unternehmen aus. Allerdings sind nicht alle Daten gleich wichtig: Auf manche wird sehr regelmäßig, auf andere nur selten zugegriffen. Durch die Festlegung von Richtlinien, die diese inaktiven Daten automatisch vom teuren Primary-Storage auf Archivierungsmedien verschieben, können Kosten gespart und Ressourcen geschont werden. Gleichzeitig muss der problemlose Zugriff auf archivierte Daten gewährleistet werden.
1. Zusammenstellung der technologischen Speicherinfrastruktur
Datenmanagement Diagramm: Branchen mit anspruchsvollen Workflows verschieben die Daten mittels einer intelligenten Datenmanagement-Software vom primären Speicher auf weitere Speicherebenen (Grafik: Quantum).Im Unternehmensumfeld ist die Datenspeicher- und -sicherung eine hochkomplexe Angelegenheit, da die Anzahl der Daten und Quellen beständig wächst, sodass die händische Verwaltung nicht mehr effizient gehandhabt werden kann. Die Verschiebung der Daten vom Primärspeicher auf die Archivierungsebene muss automatisiert ablaufen, um den Zeitaufwand zu reduzieren. Zudem reicht die traditionelle Storage-Technologie nicht mehr aus, um Datenvolumina im PByte-Bereich zu verwalten, da sie in den Bereichen Verlässlichkeit und Effizienz nicht die Anforderungen erfüllen und zu teuer sind.
Wer auf einen goldenen Datenmanagement-Weg hofft, wird enttäuscht. Es gibt keinen »One size fits all«-Ansatz. Was für ein Unternehmen die ideale Lösung darstellt, kann in einem anderen Unternehmen völlig kontraproduktiv sein. Je nach Geschäftsziel muss eine flexible, maßgeschneiderte und mehrstufige Architektur aus beispielsweise Tape-Librarys, Disk, Object-Storage oder Cloud implementiert werden.
2. Sicherung der Metadaten
Dateien bestehen aus zwei Komponenten: Den Inhalten selbst sowie den zugehörigen Metadaten, welche für die Klassifizierung und Lokalisierung der Dateien eine entscheidende Rolle spielen. Sie geben Auskunft über die Herkunft der Daten, ihre Zusammensetzung, kodieren Regeln für die Transformation der Daten aus den Quelldatenbeständen und liefern Information über verdichtete Daten und deren Hierarchien.
Die Erfassung und Pflege von Metadaten stellt einen essentiellen Teil des Verwaltungsprozesses dar. Die Sicherung und Archivierung der Metadaten vernachlässigen viele Unternehmen bereits. Gehen Metadaten verloren, ist es beinahe unmöglich, die entsprechenden Inhalte rechtzeitig zu finden, was bedeutet, dass die Inhaltsbibliothek praktisch nutzlos ist.
Metadaten und Inhalte werden getrennt aufbewahrt, da sich aufgrund der Dateigrößen die Zugriffsmuster unterscheiden. Handelt es sich bei den Dateien beispielsweise um Videos, kann das Volumen einer einzigen Datei mehrere hundert Giga- oder Terabytes ausmachen. Es ist sinnvoll, sie auf Speichermedien mit hohen Kapazitäten und niedrigen Latenzzeiten zu sichern und bei Bedarf per Stream abzurufen, um eine flüssige Wiedergabe zu ermöglichen und Dropped-Frames zu vermeiden. Die Metadaten hingegen beanspruchen viel weniger Kapazität – manchmal sind es nur wenige KByte, da der Großteil der Informationen aus einer Textdatei oder einem Datenbankeintrag besteht, weshalb Metadaten auch auf traditionelleren Speichermedien gesichert werden können.
3. Automatisierung durch Erstellung von Richtlinien
Zunächst müssen Richtlinien und Regeln für die Archivierung von Daten erstellt werden, welche die folgenden Punkte beachten:
- Je nach Datentyp gelten unterschiedliche Kriterien für die Archivierung.
- Einstellung der Mechanismen, die für den Archivierungsprozess zum Einsatz kommen.
- Festlegung der Archivierungsmedien.
- Festlegung des Zeitraums, in dem die Daten im Archiv bleiben; je nach Datentyp kann es hier Unterschiede geben.
- Festlegung der Zugriffsrechte für unterschiedliche Nutzer.
Die Daten werden klassifiziert und abhängig vom Datentyp, ihrem Wert und Zugriffszeiten auf unterschiedlichen Speicherebenen archiviert. Die Speicher- und Archivierungsvorgänge müssen zudem geschäftsrelevant sein und über die Möglichkeit verfügen, den Speicherort und die Datenbewegung mit Parametern wie Datenquelle, Datentyp, Nutzer und weiteren organisationalen und prozessualen Unternehmensinformationen zu verknüpfen.
Bezüglich der Metadaten sollten Unternehmen Richtlinien erstellen, bei der die Metadaten bereits von Erstellung einer neuen Datei an, über alle Stufen des Workflows hinweg, zuverlässig gesammelt werden. Sind die Inhalte finalisiert und werden archiviert, sollten gleichzeitig auch die Metadaten archiviert werden, um sie später für die Mehrfachnutzung wieder heranziehen zu können. Das klingt zunächst nach viel Aufwand, bietet jedoch ein hohes Einsparpotenzial, ohne den Anwender in seiner täglichen Arbeit in Mitleidenschaft zu ziehen.
Die wichtigsten Punkte auf einen Blick:
- Unterscheiden Sie zwischen Archivierung und Backup um Kosten zu senken.
- Vermeiden Sie proprietäre Formate – das birgt die Gefahr, dass sie im schlimmsten Fall Ihre Daten in ein paar Jahren nicht mehr lesen können.
- Investieren Sie Zeit in die Regelfindung – das spart Ihnen in Zukunft viel Ärger und erneuten Zeitaufwand.
- Implementieren Sie auch Regeln für die Löschung von Daten.
- Vergessen Sie auf keinen Fall Ihre Metadaten! So bleiben Ihre Inhalte auch langfristig auffindbar.
Storage- und Archivierungslösungen im Überblick
1. Tape-Libraries
Mit Tape-Libraries können vergleichsweise kostengünstig große Datenmengen gesichert werden, bei häufigen Bandwechseln bringen sie jedoch einen hohen Konfigurations- und Verwaltungsaufwand mit sich. Sie bieten sich vor allem für das Staging und die langfristige Archivierung an.
2. Disk
Backup-to-Disk bietet eine höhere Datenübertragungsgeschwindigkeit als Bänder. Da Disks nur über begrenzte Speicherkapazitäten verfügen, werden sie häufig für die Langzeitarchivierung in Kombination mit Tape eingesetzt, was dem Prinzip einer mehrstufigen Archivierungsstrategie entspricht.
3. Object-Storage
Object Storage-Systeme sind bezüglich der Skalierbarkeit nicht limitiert, ermöglichen verteilte Zugriffe und unterstützen individualisierbare Metadaten. Ein weiterer Vorteil von Object Storage liegt darin, dass Daten global auf Rechenzentren an verschiedenen Standorten verteilt werden können; je nach Object-Storage-System sogar über heterogene Disks und Knoten.
4. Cloud
Ähnlich wie bei Object Storage bietet die Cloud Zugang zu einem quasi unbegrenzten externen Speicherpool, auch die Datensicherung über mehrere Standorte hinweg ist problemlos möglich. Bei einer langsamen Verbindung kann sich das Hochladen großer Datenmengen als problematisch erweisen.
Quantum GmbH
Willy Brandt Allee 4, 81829 München
Tel.: + 49 (0) 89 - 943 03-0, Fax: + 49 (0) 89 - 94 30 35 55
E-Mail: info-germany@quantum.com