Anzeige

EMC Isilon dockt an Hadoop-Lösung »Greenplum HD« an

Datenanalyse (Greenplum) und Datenspeicherung (Isilon) wachsen zusammen (Bild: EMC)
Datenanalyse (Greenplum) und Datenspeicherung (Isilon) wachsen zusammen (Bild: EMC)
Big Data heißt, nicht nur Unmengen von Daten und Dokumenten speichern zu können, sondern auch zu analysieren und durchzuforsten, um wertvolle Unternehmensinformationen herausfiltern zu können. In beiden Disziplinen hat sich EMC im Jahr 2010 verstärkt: Zunächst mit der Übernahme von Greenplum und ihrer auf der Open-Source-Lösung »Hadoop« basierenden Analytics-Plattform, und anschließend mit Isilon und ihren Scale-out-NAS-Storage-Systemen.

Nun bringt EMC beides zusammen, und offeriert branchenweit die erste auf Hadoop aufsetzende integrierte Gesamtlösung. Hadoop ging aus einem Apache-Projekt hervor. Die Lösung ist bekannt dafür, strukturierte wie auch unstrukturierte Daten schnell zu analysieren. Allerdings mit einem Manko: Die Ansprache des Speichersystems war bislang extrem komplex und resourcenfressend. Nur rund ein Drittel des angeschlossenen Speichers stand für Daten bereit, die restlichen zwei Drittel belegte Hadoop mit Redundanzdaten.

Anzeige

»OneFS 6.5« unterstützt nun »Hadoop Distributed File System«-Protokoll (HDFS)

Dieses Manko hat EMC nun eigenen Angaben zufolge mit der extrem engen Verzahnung der Greenplum-HD-Lösung und des Isilon-Speicher ausgemerzt. Dazu wurde das Isilon-Betriebssystem »OneFS 6.5« auf Vordermann gebracht, und unterstützt nun systemintern das »Hadoop Distributed File System«-Protokoll (HDFS). »Damit ist unsere Lösung die branchenweit erste und einzige nachweislich für den Unternehmenseinsatz geeignete Hadoop-Lösung, die auf einer Scale-out-NAS-Architektur beruht«, betont Will Davis, Product Marketing Manager bei EMCs Greenplum-Geschäftsbereich, im Gespräch mit speicherguide.de. »HDFS ist ein Schlüsselelement in Hadoop.«

EMC-Isilon-Kunden können somit nun große, auf Hadoop-Basis verarbeitete Datenmengen, umfassend und übergreifend zu schützen. »Anwender können nun unter anderem auf Snapshot-, Replizierungs und Backup-Funktionen zurückgreifen«, erläutert Davis. »Das war bisher in diesem Umfang so nicht möglich.«

»NameNode« jetzt kein Single-Point-of-Failure-Risiko mehr

Generell stand bislang der breiten Einführung einer so hoch integrierten Analyse-Lösung entgegen, dass traditionelle Speicherinfrastrukturen in der Regel nicht auf die Bewältigung von Big Data ausgelegt sind. Unter anderem verhinderte der mangelnde gemeinsame Zugriff auf Daten die Durchführung aussagekräftiger Analysen.

Die EMC-Isilon-Lösung soll nun diese Einschränkungen aufheben. Neben dem integrierten Zugriff auf unternehmensweit bereitstehende Data-Protection-Funktionen zeichnet sich diese Lösung auch dadurch aus, dass sich Daten über ein breites Spektrum an Standardprotokollen wie NFS, CIFS, FTP oder http schnell verschieben lassen. Die Integration von HDFS schützt Anwender vor dem traditionellen Hadoop-Lösungen anhaftenden Nachteil, dass der »NameNode« ein Single-Point-of-Failure-Risiko darstellt. Darüber hinaus erhalten Kunden die Freiheit zu entscheiden, welche Apache-Hadoop-Distribution sie in ihrer Umgebung unternehmensweit einführen und nutzen möchten.

Auch wenn Hadoop Open-Source – EMC sieht auch Geschäftsmöglichkeiten für ihren »EMC Global Services Big Data Advisory Service«; er soll Kunden dabei helfen, mit der Verarbeitung von Big Data in Verbindung stehende Geschäftschancen zu erkennen und zeichnet die Schritte vor, die für die Nutzung der Informationen in Unternehmen notwendig sind. Zudem stehen EMC-Service-Experten für die Konfiguration der Greenplum- und Isilon-Systeme und deren Integration in die jeweils vorhandene Umgebung zur Verfügung.

EMC ist mit Hadoop vorne dran – aber nicht alleine

Die angekündigten Produkte lassen sich ab heute weltweit bestellen. Die Auslieferung soll am 10. Februar starten. Angaben zur Preisgestaltung machte EMC nicht. Interessenten sollten jedoch davon ausgehen, dass die Kosten für den Isilon-Speicher bei etwas unter 1.000 US-Dollar pro TByte liegen dürften. Da die Lösung auf »Standard Stock Keeping Units« (SKUs) von EMC basiert, eignen sie sich auch für bestehende zertifizierte Vertriebspartner.

Allerdings: Ganz alleine ist EMC nicht mit seiner Hadoop-Lösung. Konkurrent NetApp hat sich hier mit dem Hadoop-Lösungsanbieter Cloudera zusammengetan, um eine ähnliche Lösung zu offerieren. Und auch IBM, Microsoft und Oracle machten Ankündigungen, mit eigenen Hadoop-Distributions auf den Markt zu kommen.

.
Anzeige