Anzeige

Welches alternative File-System für welchen Zweck?

Leserfrage: Eines zeigt ja die Thematik rund um Software-defined Storage klar auf: Es geht meist um alternative File-Systeme, wie zum Beispiel ZFS oder Ceph. Auch wir überlegen in unserem Rechenzentrum, eine alternative Lösung zum Testen einzusetzen. Können Sie kurz skizzieren, welche alternativen File-Systeme es gibt (bzw. die wichtigsten sind), und für welche Einsatzzwecke sie sich eignen?

Antwort Doc Storage:

In Ihrer Frage zeigt sich ein Widerspruch: Man wird kaum »kurz« skizzieren können, welche Dateisysteme es gibt und zu welchem Einsatzzweck sie sich eignen. Ich will daher versuchen, einen so kompakten Überblick wie möglich zu geben. Aufgrund Ihrer Nennung von ZFS und Ceph gehe ich davon aus, dass es sich bei der Ihrigen um eine Linux- bzw. Unix-Umgebung handelt und lasse daher FAT, NTFS und andere Windows-Alternativen außen vor. Hier die drei wichtigsten Alternativen auf diesem Sektor, ZFS, CephFS und GPFS.

ZFS (Zettabyte File System) – Schon ein Klassiker unter den Alternativen. Ursprünglich von Sun für sein eigenes proprietäres Solaris entwickelt und dann mit Solaris x86 auf die Intel-Welt portiert, bietet es gegenüber den klassischen Reiser- oder xfs-Systemen zahlreiche Erweiterungen. Im Gegensatz zu diesen bietet ZFS die Möglichkeit, aus mehreren physikalischen Festplatten ähnlich einem klassischen RAID einen Pool zu bilden, in welchem dann dynamisch wachsende und verkleinerbare Partitionen angelegt werden können. Innerhalb dieser Partitionen können schnell und einfach Snapshots bestimmter Zustände angelegt werden. Darüber hinaus unterstützt ZFS seit einiger Zeit Deduplikation. Ein gewisser Nachteil ist die Leistung von ZFS, die durch die übermäßige Ausstattung an Werkzeugen, Paritäten, Checksummen und anderem nicht an diejenige »einfacherer« Dateisysteme heranreicht. Dafür ist ZFS so ausgelegt, dass seine mögliche Kapazität von über 280 Billionen Yottabyte relativ lange ausreichen dürfte.

CephFS ist ein vor allem für den Einsatz in Clustern entworfenes, verteiltes Dateisystem. Entgegen den klassischen Lösungen können die Daten hier über eine beliebige Anzahl an Rechnern ausfallsicher verteilt werden. Informationen werden doppelt gespeichert, bei Ausfall einer Komponente werden die noch vorhandenen Kopien automatisch wieder verdoppelt. Somit wird das System als »selbstheilend« bezeichnet.

GPFS (General Parallel File System) ist von IBM für die Plattformen Linux, Windows und AIX entwickelt worden und mit fast 20 Jahren schon relativ »erfahren«. Zusätzlich zu herkömmlichen Dateisystemen erlaubt GPFS unter anderem den parallelen Zugriff auf gespeicherte Informationen von mehreren Rechnern aus, eine integrierte Verschlüsselung und ILM über den Daten zugeordnete Regeln.

Falls Sie weitergehende Fragen speziell zu einem dieser Dateisysteme haben sollten, oder aber zu einem hier nicht genannten, bitte ich um entsprechende Nachricht, ich werde dann versuchen eine Beschreibung nachreichen.

Gruß
Doc Storage

Anzeige