Update: Speicherschnittstelle mit einer Milliarde I/Os
Leserfrage: Die Firma Fusion-IO hat gerade eine Lösung angekündigt und demonstriert, die bis zu eine Milliarde I/Os abarbeiten kann. Wie sinnvoll ist eine solche Lösung und wer kann sie wirklich nutzen? Muss man bei einer virtualisierten Server-Farm solche Produkte näher betrachten oder schaffen das noch die herkömmlichen Speichersysteme?
Antwort Doc Storage:
Fusion-IO entwickelt eine funktionsreiche Speicherschnittstelle, die ihre traditionellen Stärken bei kurzer Reaktionszeit und hoher Gesamtleistung gegen die Funktionalitäten der alteingesessenen Speicherhersteller ausspielen soll, beispielsweise Tiering, Replikation und Schutz der Daten. Das Unternehmen hat in der letzten Woche in einem Aufbau mit acht HP-Servern mit jeweils acht eingebauten »ioDrive« PCIe Flash-Speichern über eine Milliarde I/O-Operationen vorgeführt. Diese Leistung wurde durch das neue ACM (Auto Commit Memory) möglich, welches den Fusion-IO VSL (Virtual Storage Layer) erweitert. Hiermit wird den CPUs der Rechner annähernd direkter Zugriff auf die Flash-Speicher gewährt und so extrem niedrige Zugriffszeiten und hohe I/O-Leistungen ermöglicht.
ACM ermöglicht den direkten Zugriff auf die Flash-Speicher, welche durch die CPU eher als RAM denn als Massenspeicher adressiert werden. Mit ACM umgeht Fusion-IO die Standard-Speicherschicht der Betriebssysteme und so annähernd DRAM-Geschwindigkeit mit ihren Flash-Speichern zu erzielen. In ihrem Demonstrationsaufbau mit über einer Milliarde I/O-Operationen nutzte Fusion-IO 64-Byte-Blöcke (im Gegensatz zu den sonst üblichen 4- oder 8-KByte-Blöcken). Damit wird der Vergleich zu traditionellen I/Os schwierig, ebenso der mit dem Netto-Datentransfer herkömmlicher Speicherlösungen.
Um das Produkt für breite Schichten nutzbar zu machen, hat Fusion-IO ursprünglich eine Standard-Block-Device-Schnittstelle angeboten, die viele der Vorteile von VSL wieder zunichte gemacht hat. Eigentlich hoffte Fusion-IO, dass Rechnerhersteller ihre eigenen Erweiterungen zu VSL entwickeln würden. Da dies allerdings nicht passiert ist, hat das Unternehmen nun eigene Zusätze geschrieben. Hierzu hat Fusion-IO in letzter Zeit sehr viele Software-Entwickler eingestellt.
Einerseits macht die direkte Schnittstelle zur CPU Fusion-IO mit ACM und VSL zu einem einmaligen Produkt im Markt. Allerdings arbeiten andere Hersteller, allen voran EMC mit ihrem Projekt Lightning, in genau diesem Segment, um vergleichbare Angebote noch in diesem Jahr herauszubringen. Und dieses wird dann einige entscheidende Vorteile haben, nämlich die Kopplung mit über SAN angeschlossenen Speichersystemen und eine Verwaltungsschicht über den einzelnen Rechner hinaus. Geschwindigkeit allein ist in Umgebungen mit sensiblen Daten eben doch nicht alles.
[Update] Zunächst einmal müssen wir die angeblich so hohe Leistung der Fusion-IO-Lösung ins richtige Licht setzen. Die »eine Milliarde IOs« wurden wie bereits erwähnt mit einer Transaktionsgröße von lediglich 64 Byte erzielt, einem Wert, der ein 64tel bzw. ein 128tel der sonst üblichen 4- oder 8-kByte-Blockung entspricht. Lassen wir einmal die Verluste durch Paketköpfe und -füße außer Acht, so handelt es sich um ein Datenvolumen, welches gerade einmal knapp 16 Millionen bzw. knapp acht Millionen IOs entspricht. Immer noch eine immens hohe Leistung, allerdings weit entfernt von der einen Milliarde, die die Fusion-IO-Presseabteilung in übergroßen Lettern auf die eigene Internetseite schreiben ließ.
Eine Milliarde mal 64 Byte entspricht 59,6 GByte an Daten pro Sekunde, wohlgemerkt ohne Transport-Overhead. Das sind Werte, die sich bereits heute mit breit angebundenen, großen Speichersystemen erreichen lassen. Und ebenso wohlgemerkt hat Fusion-IO zur Erzielung des Ergebnisses acht Rechner mit acht Speicherkarten, also rein theoretisch 64 PCIe-Kanäle genutzt. Ein Aufbau mit acht Standardrechnern mit jeweils acht Standard-FC-HBAs erzielt mit den heute üblichen 8-Gbit-Anbindungen ebenfalls einen Durchsatz von deutlich über 50 GByte pro Sekunde. Im richtigen Licht ist die Leistung der Fusion-IO-Lösung also nichts besonderes, außer daß sie sich mit wesentlich geringerem infrastrukturellen Aufwand erzielen läßt.
Die Frage ist also nicht, für wen die Lösung geeignet ist, sondern eher, wer für sie zu zahlen in der Lage und bereit ist. Und da geraten wir dann schon eher in Kundenregionen, in denen Geld eine geringere Rolle spielt als die mit der DV erzielten Ergebnisse.
Ich rechne damit, daß die ersten Installationen im Markt im HPC-Umfeld zu sehen sein werden. Danach in der Forschung mit finiten Elementen und in der Chemie. In der breiten Masse wird die CPU-nahe Technologie wohl erst in den kommenden fünf bis zehn Jahren Fuß fassen. [/Update]
Gruß
Doc Storage