Backgrounder Network-Attached-Storage (NAS)

01.01.2013 kfr

Backgrounder Network-Attached-Storage (NAS)

NAS-Systeme sind Fileserver, die Daten und Speicherplatz im Netzwerk für zahlreiche Benutzer verfügbar machen. Neben Funktionen wie Zugangsverwaltung, Online-Backup oder Archivierung müssen sich die Netzwerkspeicher auch für die virtuellen Welten rüsten.

Von Karl Fröhlich und Ulrike Rieß

NAS: prinzipieller Aufbau (Grafik: speicherguide.de)Mit vernetzten Speichersystemen verfolgen Unternehmen drei grundsätzliche Ziele: Konsolidierung, Zusammenarbeit und Verteilung. NAS-Systeme sind entwickelt worden, um in kleinen Umgebungen ohne einen zentralen Server einfach und unkompliziert Speicherplatz zur Verfügung zu stellen. Ebenso finden diese Geräte in mittleren und größeren IT-Anlagen heute ihren Einsatz als Online-Backup und Online-Archiv-Systeme, um auch hier weiteren Speicherplatz zu bieten. Dies entlastet die Server und hilft die vorhandenen Storage-Einheiten effektiver zu verwalten.

NAS-Architekturen setzen auf eine zentralisierte Datenhaltung, benutzen dafür allerdings einen dedizierten Server, der ausschließlich der Datenverwaltung dient und über eine Ethernet-Verbindung in das Unternehmensnetz integriert wird. NAS ermöglicht dadurch das Filesharing zwischen verschiedenen Betriebssystemen. Dafür werden die Protokolle NFS (Network-File-System), CIFS (Common-Internet-File-System) sowie für PC-Datenstrukturen http genutzt. Ein weiterer Pluspunkt ist, dass der Speicher nicht nur relativ problemlos erweiterbar ist, eine zentralisierte Management-Oberfläche ermöglicht es dem Administrator darüber hinaus Kapazitäten bedarfsgerecht flexibel zuzuweisen. Klare Vorteile haben NAS-Lösungen für Anwendungen, die fileorientierten Zugriff benötigen wie File-Server-Konsolidierung und CAD-Systeme.

Netzwerkarten: Kanal- und IP-Netze

Die Anbindung erfolgt in der Regel über IP-Netzwerke mit Bandbreiten von einem Gbit. Der größte Vorteil dieser LANs liegt in ihrer ausgereiften und weit verbreiteten Technologie, die es Unternehmen erlaubt, existierende Infrastrukturen und Fachwissen weiter und besser zu nutzen. Des Weiteren sind IP-Netze gut dazu geeignet, zuverlässig Daten über annähernd beliebige Entfernungen zu transportieren und dabei durch automatische Ersatzwegschaltung auch mit dem Ausfall einzelner Komponenten fertig zu werden.

Weniger geeignet sind NAS-Lösungen daher bei klassischen Datenbanken sowie einigen E-Mail-Anwendungen, die das NAS-Konzept nicht unterstützen. Auch bei Anwendungen, die eine schnelle Latenzzeit benötigen, wie beispielsweise Video-Anwendungen, sind NAS-Lösungen üblicherweise nicht die erste Wahl. Da der gesamte Datenverkehr über das vorhandene Unternehmensnetz läuft, sollten NAS-Lösungen nicht in Netzen mit ohnehin hoher Netzwerkauslastung zum Einsatz kommen. Nur ein Gerät kann zu einer Zeit eine IP-Verbindung nutzen – sollte also ein Rechner hohe Netzwerklast erzeugen, hat dies Auswirkungen auf die Verbindung zu allen anderen Geräten im Netz.

Dateiverfahren und Filesharing

Im Gegensatz zu SANs erfolgt bei NAS-Systemen die Datenübertragung im Dateiverfahren und nicht blockorientiert. Bei diesem Dateizugriff werden Daten nur über ihre Namen angesprochen, nicht über ihren Speicherplatz. Deswegen ist ein separater Rechner (ein so genannter Fileserver) nötig, um über die Angabe des Namens an die Inhalte von Dateien zu gelangen. Dieser Host erhält die Lese- oder Schreibanforderungen einer kompletten Datei und arbeitet den Blockzugriff auf den Datenträger hinter den Kulissen ab. Weil die angeschlossenen Rechner nur den Namen der Datei, aber nicht die physikalische Adresse der einzelnen Blöcke kennen müssen, ist es möglich, dass viele Systeme gleichzeitig auf einen einzigen Datenbestand zugreifen. Dies ist der Hauptvorteil des Dateizugriffs, der allerdings durch einen weiteren Rechner im Datenpfad, höhere Komplexität und möglicherweise eingeschränkte Leistungsfähigkeit erkauft wird.

Der gemeinsame Zugriff auf Daten von unterschiedlichen Systemen ist der Schlüsselvorteil der NAS-Technologie. Anwendungen und Daten vieler verstreuter Systeme können auf einem einzigen zusammengefasst und zur gemeinsamen Arbeit bereitgestellt werden. Skalierbare Hochleistungs-NAS-Systeme werden oft dazu genutzt, viele kleinere Unix- oder Windows-Server zu ersetzen. Dadurch lassen sich Kosten für den Einkauf und den Unterhalt der Speichersysteme senken. In Entwicklungsumgebungen (z.B. CAD, Software oder Forschung) können NAS-Systeme durch Zusammenarbeit am selben Datenbestand Projektlaufzeiten verkürzen und somit höhere Effizienz durch kürzere Produktzyklen ermöglichen. Auch im Bereich von Web-Hosting setzen sich NAS-Systeme immer weiter gegen dedizierte Server durch.

Filesharing-Anwendungen, für die sich NAS-Systeme besonders eignen, sind solche, die zwei oder mehr Einzelapplikationen betreiben oder viele Nutzer haben, die auf ein und denselben Datenbestand zugreifen müssen. In der Software-Entwicklung ist es beispielsweise erforderlich, Code-Module mehreren Ingenieuren gleichzeitig zur Verfügung zu stellen. Mit NAS ist es nicht mehr notwendig, mehrere Kopien einer Datei auf vielen Speichern vorzuhalten. Ein anderes Beispiel sind Web-Umgebungen. Ein NAS-System kann ein einziges Abbild einer Webseite an Dutzende oder Hunderte Server verteilen, die wiederum einen wesentlich breiteren Zugriff auf diese Seite ermöglichen.

File-Virtualisierung für höhere Flexibilität

Auch der Trend zur Virtualisierung macht vor NAS-Architekturen nicht halt. Nur geht es hier nicht wie im SAN um die freie Zusammenfassung oder Zuordnung von Speicherplatz zu neuen, dem Rechner als Ganzes präsentierten Laufwerken. Vielmehr werden hier so genannte Namensräume (Namespaces) geschaffen, denen sich dann nach Belieben Dateien zuordnen lassen. Ein Namensraum wird gegenüber den teilnehmenden Rechnern wie ein Wurzelverzeichnis mit Unterverzeichnissen dargestellt, den Zugang zu dieser Baumstruktur regelt eine entsprechende Software. Der Vorteil einer solchen Virtualisierung liegt darin, dass Dateien eben nicht mehr auf dedizierten Servern gespeichert und von ihnen aus zur Verfügung gestellt werden, sondern sich von beliebiger Stelle im Netzwerk aus in beliebiger Form präsentieren lassen. Wird eine neue Verzeichnisstruktur gewünscht oder sollen Server verlegt, zusammengelegt oder eliminiert werden, lassen sich die hier gespeicherten Dateien leicht anderen Verzeichnissen zuordnen und mit deren Zugangskontrollen sichern. Dadurch lässt sich zum einen die Verwaltung vereinfachen und zum anderen die Limitierung der Speicherkapazitäten aufheben. (siehe auch Artikel zu File-Virtualisierung).

Deduplizierung

Auch das Thema Deduplizierung hat NAS erreicht. Allerdings arbeiten die meisten Systeme tatsächlich nicht auf Dateiebene, sondern »sehen« in diese hinein und vergleichen kleinere Unterabschnitte miteinander. Weitere Kopien kompletter Dateien werden heute nur noch in Archivsystemen mit Platzhaltern versehen, die dann ihrerseits auf das Original verweisen. Alle anderen Technologien vergleichen Dateiteile auf gemeinsame Zeichenketten miteinander und ersetzen diese dann durch Zeiger auf das jeweilige Original. So lassen sich wesentlich größere Abschnitte der gespeicherten Daten reduzieren. Auch im NAS-Segment gibt es Deduplikation an der Datenquelle (bevor überhaupt endgültig gespeichert wird) oder am Speicherort (also nachdem die Informationen im Dateisystem abgelegt wurden). Die erste Option ist die effizientere: Hier muss letzten Endes weniger Speicherplatz vorgehalten werden und es ist keine ständige Defragmentierung der Zieldateisysteme nötig.

NAS ist nicht gleich NAS

Grundsätzlich unterteilen sich NAS-Produkte in Standard-PCs und spezialisierte NAS-Systeme. Herkömmliche Rechner mit Unix- oder Windows-Betriebssystem bieten mehr Flexibilität auf der Plattform: Indem auch Anwendungen auf ihnen laufen, können sie mehr als nur ein Dateiserver sein. Typischerweise installieren Unternehmen, die NAS auf PC-Basis einführen, eine homogene Server-Infrastruktur, also ausschließlich Unix- oder Windows-Rechner. Diese Server haben grundsätzlich niedrigere Anschaffungskosten als spezialisierte NAS-Systeme. Andererseits fallen sie meist im Preis/Leistungs-Verhältnis hinter diese zurück. Grund dafür sind die eingesetzten Betriebssysteme, die hauptsächlich für den Betrieb von Anwendungen entworfen wurden. Das heißt, sie sind nicht für den NAS-Betrieb optimiert. Darüber hinaus ist es schwieriger, Dateien zwischen unterschiedlichen Betriebssystemen auszutauschen, da es sich meist um herstellerabhängige und somit proprietäre Formate handelt. Sollen Daten zwischen Unix und Windows ausgetauscht werden, benötigt mindestens eine Seite zusätzliche Software, und das erhöht Komplexität und Fehleranfälligkeit. Darüber hinaus verfügen die wenigsten Standardrechner über integrierte Speicherverwaltung, Ausfallsicherheit oder Backup.

Spezialisierte NAS-Systeme besitzen gegenüber diesen Standardrechnern deutliche Vorteile bei Leistung und Skalierbarkeit. Ihre Betriebssysteme wurden für eine einzige Aufgabe entworfen – als Dateiserver. Sie betreiben NFS für die Unix-Welt und CIFS für die Windows-Welt sehr effizient, schnell und vor allem parallel, ohne zusätzliche Software auf den angeschlossenen Rechnern zu benötigen. Allerdings können NAS-Systeme keine oder auch wieder nur proprietäre Anwendungen betreiben. Wegen ihrer Auslegung als speicherzentrische Architekturen können sie einfach skaliert werden und sind einfacher als Cluster und somit ausfallsicher auslegbar. Zwar sind NAS-Systeme in der Anschaffung teurer als Standardrechner, eignen sich allerdings wesentlich besser für den Einsatz in kritischen Umgebungen, die hohe Leistung und Verfügbarkeit erfordern. Noch wichtiger ist die Möglichkeit zur Konsolidierung der Infrastruktur und damit zur langfristigen Senkung der Betriebskosten im Rechenzentrum.

Ein weiterer Bereich sind Server-Konsolidierungen. Hier geht es darum, viele Standard-Hosts durch ein einziges NAS-System zu ersetzen. So sind beispielsweise 30 bis 50 Prozent aller Daten auf Plattensystemen Heimatverzeichnisse, gemeinsam genutzte Dokumente oder andere unstrukturierte Daten. NAS ermöglicht es, all diese Informationen zu konsolidieren und mehr Anwendern im Netzwerk zur Verfügung zu stellen.

NAS mit Snapshots und mehr

Selbst in NAS-Systemen finden sich mittlerweile Funktionen, die früher nur für viel Geld von großen Herstellern zu erwerben waren. Das wiederum macht diese Systeme flexibler und effizienter.

Eine aus der SAN-Welt bekannte Technik sind Snapshots, sprich Zustandsabbilder eines Laufwerks zu einem bestimmten Zeitpunkt. Diese können als Backups, für Testzwecke im Entwicklungsumfeld oder für jedes andere Verfahren genutzt werden, bei dem eine Kopie der Produktionsdaten benötigt wird. Die physikalische Größe dieser Snapshots hängt von der Änderungsrate auf dem Laufwerk ab. Je mehr geschrieben – also geändert – wird, desto größer wird der benötigte Speicherplatz. NAS-Systeme bieten bis zu mehrere hundert Snapshots, die sich von außen wie unabhängige Laufwerke ansprechen lassen.

Selbst bei der einfachen Sicherung hat sich vieles im NAS-Umfeld getan. Einige Hersteller erlauben ein Backup mit Checkpoints, Dateifiltern und auf Laufwerksbasis. Mit dem integrierten Checkpointing lassen sich abgebrochene Sicherungen wieder aufsetzen, ohne den gesamten Vorgang erneut zu starten. Ein weiteres Mittel zur Vereinfachung der Sicherungsaufgaben sind Dateifilter, mit deren Hilfe sich Dateien zur Sicherung markieren lassen – zum Beispiel solche mit bestimmten Erweiterungen oder Inhalten oder solche von bestimmten Erzeugern. Ebenfalls hilfreich ist die selektive Sicherung bestimmter physikalischer Laufwerke, auf denen die freigegebenen Dateisysteme aufgesetzt sind. Produkte mit »Auto Volume Extension« überwachen selbstständig den belegten Speicherplatz und mahnen die eventuell notwendige Erweiterung der Dateisysteme an.

NAS und iSCSI

Speziell in kleinen und mittleren IT-Umgebungen steht NAS in Konkurrenz zu iSCSI. Doch wie schon seinerzeit mit SAN hinkt der Vergleich. Je nach Anforderung und künftigen Ansprüchen besitzen beide Technologien ihre Vorteile. NAS empfiehlt sich vor allem, wenn schnell mehr Speicherplatz benötigt wird.
Wurden NAS-Systeme bis vor kurzem ausschließlich im reinen IP-Netz betrieben, stehen nun auch Anschlussoptionen um iSCSI zur Verfügung. Dieser Schritt liegt auf der Hand. Zum einen müssen IT-Manager die bestehenden Infrastrukturen nicht ändern, um neben dem Datei- auch den Blockzugriff zu ermöglichen. Zum anderen lassen sich alle Sicherheits- und Verwaltungsvorteile nutzen, die bisher der Kanalanbindung vorbehalten blieben. Darüber hinaus kann damit auch auf ursprünglichen Dateisystem-Freigaben wie auf physikalischen Laufwerken gearbeitet werden.

iSCSI wurde als kostengünstige Lösung für kleinere und mittlere SANs entwickelt. Hier liegt das Hauptaugenmerk im Zugriff auf blockorganisierten Speicherplatz, der von zentralen Servern aus kontrolliert, verwaltet und zugewiesen werden kann. Die über Server verwalteten Online-Archive oder auch die Online-Backup-Sätze sind ebenso wichtige Anwendungen, aber auch der Aufbau von redundanten Server-Clustern und die in diesem Zusammenhang oft realisierten Datenbank-Applikationen.

Grundsätzliche Unterschiede NAS und iSCSI



	NAS-System	iSCSI-System
Ist das System auch klassisch als DAS (Direct-Attached-Storage) einzusetzen?	nein	ja
Wer greift direkt auf das System zu?	Benutzer	Server/PC
Was wird über das Netzwerk zur Verfügung gestellt?	ein Filesystem	blockorganisierter Speicherplatz
Wer organisiert die Daten und das Filesystem?	das NAS-System	das Betriebssystem des Servers/PC
Wie wird die Zugriffsberechtigung organisiert?	durch das NAS-System, ggf. Active-Directory	über das Betriebssystem des Servers/PC
Kann das System in einem Server-Cluster betrieben werden?	nein	ja
Wo muss das System installiert sein?	lokale oder dezentrale LAN-Umgebung, ggf. über VPN	lokale oder dezentrale LAN-Umgebung, ggf. über VPN
Ist das Storage- System mit Datenbanken einsetzbar?	eher nein	ja
Ist der Einsatz als Backup-to-Disk- Lösung möglich?	ja	ja
Ist der Einsatz in SOHO-Umgebungen optimiert?	ja, bei kleineren NAS-Geräten	nein
Ist der Einsatz für mittlere IT-Umgebungen optimiert?	ja, bei mittleren und großen NAS-Geräten	ja

In der Praxis lässt sich meist nicht eindeutig klären, ob NAS oder iSCSI den höheren Datendurchsatz aufweisen. Dabei spielt es keine Rolle, ob als Netzwerkprotokoll NFS/CIFS oder TCP/IP zum Einsatz kommen. Bei Verwendung des gleichen LANs wie beispielsweise Gbit-Ethernet ist iSCSI nicht grundsätzlich schneller als NFS/CIFS. Durch die verschiedenen Protokolle NFS/CIFS über TCP/IP und iSCSI mit SCSI-Protokoll kann es zu Gunsten des einen oder anderen Protokolls zu geringen Unterschieden kommen.

Die Frage ist am Ende also weniger, welche der beiden Techniken mehr Durchsatz erreicht. Entscheidend ist vielmehr, ob ein Unternehmen für das Erreichen der gleichen Leistung mehr lokale Prozessoren oder spezielle TOE-Karten (TCP/IP-Offload-Engine) einsetzen oder gleich in dedizierte NAS-Technik investieren will.

Checkliste NAS-Systeme

1. Festplatten
Neben der Kapazität der Platten sollte die Erweiterbarkeit und die Art der Medien – Fibre-Channel, SAS, SATA – beachtet werden.

2. Verfügbarkeit
Hinsichtlich der Systemverfügbarkeit gilt es Komponentenredundanz und NVRAM zu überprüfen. Bei RAID geht es in erster Linie um die Art der RAID-Gestaltung und zusätzliche Schutzmechanismen. Datenverfügbarkeit ist eine Frage von Snapshots sowie Backup und Restore.

3. Performance
Die Performance wird durch den Datendurchsatz im Netzwerk bestimmt, hängt aber auch von der Anzahl der gleichzeitigen Client-Zugriffe und der Art der Applikationen ab. Der NAS-Server sollte dazu passen.

4. Protokolle
Homogene und heterogene Umgebungen besitzen jeweils andere Anforderungen, so dass die Mechanismen für die Wahrung der Datenintegrität geklärt werden müssen.

5. Connectivity
Art und Umfang der Connectivity bestimmen das Einsatzspektrum des NAS-Servers. Unified-Storage ist interessant für NAS- und SAN-Unterstützung in einem System und sollte auf nachträgliche Ergänzbarkeit geprüft werden.

6. Administration
Der Aufwand für die Administration sollte genau unter die Lupe genommen werden – von der Inbetriebnahme über die Konfiguration bis hin zur Betreuung im laufenden Betrieb.

7. Unterstützung
Das Angebot an Service, Support und Zertifizierungen sollte entsprechend der Notwendigkeit als Kriterium in die Auswahl eingehen.

8. TCO
Der Kaufpreis sollte nicht alleiniges Kriterium sein. Bei den betrieblichen Kosten schlagen vor allem Administrationsaufwand, Skalierbarkeit, flexible Erweiterung und Verfügbarkeit zu Buche.

9. Unterstützung virtueller Maschinen
Mittlerweile muss ein NAS-System auch VMs ansprechen können. Anwender, die im Zuge der Konsolidierung auf die Option der Virtualisierung zurückgriffen, benötigen zwangsläufig Netzwerkspeicher mit diesen Fähigkeiten.

Weiterführende Links

SAN, NAS oder DAS: was passt wann
Schwerpunkt NAS-Systeme auf speicherguide.de

Weitere Inhalte dieses Artikels

Backgrounder Network-Attached-Storage (NAS)
Netzwerkarten: Kanal- und IP-Netze
Dateiverfahren und Filesharing
File-Virtualisierung für höhere Flexibilität
Deduplizierung
NAS ist nicht gleich NAS
NAS mit Snapshots und mehr
NAS und iSCSI
Checkliste NAS-Systeme