IBM »RamSan« – All-Flash-Systeme
Kompakte Bauform
Beide Baureihen gleichen sich äußerlich. Die 19-Zoll-Einschübe mit lediglich 1U-Bauhöhe enthalten Speicherbänke, Netzteile, Lüfter und Aktivkomponenten sowie an der Rückseite wahlweise 8-Gbit/s-FC- oder 40-Gbit/s-Infiniband-Schnittstellen. Leider sind nur die »x20«-Modelle mit im laufenden Betrieb austauschbaren Schaltnetzteilen, Netzwerk- und Flash-Karten hochverfügbar. Die »x10«-Modelle verfügen nicht über diese Merkmale und eignen sich daher weniger für den Einsatz in kritischen Umgebungen.
Die Baureihe 7x0 mit den Modellen 710 und 720 ist mit SLC-Technologie ausgerüstet und bietet ein bis fünf bzw. fünf oder zehn TByte Kapazität. Je nach Ausstattung erreichen die Systeme lesend bis zu 500.000 I/Os und schreibend bis zu 400.000 I/Os bei einem Durchsatz von maximal vier GByte pro Sekunde. Dabei sind die Antwortzeiten von lesend minimal 90 µs und schreibend durchgehend 25 µs erwartungsgemäß gering.Die Baureihe 8x0 verfügt über MLC-Speicher und bietet im Modell 810 zwei bis zehn und im Modell 820 zehn oder 20 TByte Kapazität. Lesend erreichen die Arrays bis zu 450.000 I/Os, schreibend bis zu 375.000 I/Os bei Antwortzeiten von 110 µs lesend und ebenfalls 25 µs schreibend. Der maximale Durchsatz beträgt genauso vier GByte/s.
Mehrdimensionaler Datenschutz
Beiden Baureihen gemeinsam sind die Ausstattung mit ECC-Fehlerkorrektur und Block-Remapping auf Chip-Ebene, ein mehrdimensionales RAID ebenfalls auf Chip-Ebene, integrierte zusätzliche Flashkarten und eine redundante Stromversorgung. Die Ausrüstung mit zusätzlicher Hardware, also Netzteilen und Flash-Karten, bleibt allerdings den Hochverfügbarkeits-Ausführungen der Modelle 720 und 820 vorbehalten. Die gespeicherten Daten werden in allen Systemen auf drei Ebenen geschützt. Zur ECC Fehlerkorrektur kommt ein RAID 5 auf Modulebene, das von jeder Flash-Karte über ihre Chips organisiert wird. Zusätzlich wirkt ein patentiertes variables Stripe-RAID ebenfalls pro Karte auf Chip-Ebene. In den Modellen 720 und 820 läuft zusätzlich ein RAID 5 auf Systemebene, welches gegen Datenverlust beim Ausfall ganzer Module schützt.
Einsatzgebiete für Flash-Systeme
Als ideale Einsatzfelder gibt IBM OLTP-Datenbanken, OLAP, virtuelle Infrastrukturen und Cloud-Umgebungen an. Hier verspricht der Hersteller für alle Open-Systems-Umgebungen eine bis zu 50 Prozent höhere Auslastung der Server-Hardware. Oracle-Umgebungen sollen bis zum Faktor zehn schneller werden, im SAP-Bereich spart sich der Anwender die Implementierung der teuren HANA-Architekturen und die hiermit verbundene komplexe Umstellung. Die Antwortzeiten in virtuellen Infrastrukturen sollen sich bis zu 1.500 Prozent verbessern, die Antwortzeiten verlagern sich allgemein vom Milli- in den Mikrosekundenbereich, also um den Faktor 1.000.
Ramsan im Vergleich
Was Ramsan von anderen Systemen unterscheidet, ist die für ein Speichersystem außergewöhnliche Antwortzeit von 25 µs beim Schreiben und 90 bis 110 µs beim Lesen. Nur über solche extrem kurze Antwortzeiten lassen sich Anwendungen maximal beschleunigen und parallel die CPU-Auslastungen nach oben treiben. Ramsan ist ausschließlich für diese extrem kurzen Antwortzeiten im SAN entworfen worden. Andere Anbieter, wie beispielsweise Violin Memory, können diese Antwortzeiten nur über PCIe realisieren, nicht aber über ihre Speichereinheiten im SAN. Hinzu kommt die Design-Leistung, ein Gerät mit so wenig zusätzlicher Latenzzeit zu konstruieren, so dass es hochverfügbar ist und weniger als 500 Watt verbraucht. Darüber hinaus stellt die Baureihe mit geringster Höhe beispielsweise im Modell 820 33 TByte brutto bereit, 24 TByte oder im Hochverfügbarkeitsbetrieb 20 TByte nutzbar (hier wird eine ganze Flashkarte als Spare Karte bereitgestellt). Diese Modelle sind das Ergebnis jahrelanger Entwicklung und Erfahrung mit Speichersystemen geringster Latenz. Alle anderen SSD-Architekturen sind damit nicht vergleichbar. Sie benötigen bei gleicher oder gar geringerer Kapazität bis zur dreifachen Bauhöhe und deutlich mehr Energie. Wird bei gleicher Chip-Anzahl, also auch gleicher Speicherkapazität, deutlich mehr Energie verbraucht, ist dies in den meisten Fällen ein guter Indikator für die häufige Entladung der Floating Gates. Hierdurch stehen die Oxyd-Schichten unter höherer Belastung, womit sich die Haltbarkeit der Chips wiederum massiv verkürzt.Jedes Unternehmen sollte also den Energieverbrauch bei gleichen Kapazitäten überprüfen und hierbei auch Brutto- und nutzbare Kapazitäten berücksichtigen. Die Leistungsspanne von Flash ist relativ breit, bei den Antwortzeiten von 20 µs bis über 700 µs, je nach Einbau- und Nutzungsart (PCIe, SAN Speicher, SSDs im Rechner oder SSDs im Plattensubsystem). Ramsan ist mit großem Abstand einer der schnellsten SAN-Speicher, da er ohne zusätzliche Funktionen mit nur einem Ziel entworfen wurde, nämlich höchster Leistung. Fast alle Hersteller können Systeme mit mehreren 100.000 IO/s bereitstellen oder hohen Durchsatz nachweisen. Ramsan allerdings geht es ausschließlich um niedrige Antwortzeiten. Nur diese machen Anwendungen schneller und verbessern die Serverauslastung.
Benötigt der Anwender zusätzliche Funktionalitäten wie Replikation oder Fernspiegelung, so empfiehlt IBM die Nutzung zusammen mit dem SAN Volume Controller (SVC). Ramsan kann mit all seinen Möglichkeiten, auch als Hochverfügbarkeitskonfiguration im Streched Cluster, genutzt werden, ohne die eigene Leistung einbüßen zu müssen. Der Overhead des SVC beträgt laut IBM lediglich 100 µs und ist damit mit der Kombination mit Ramsan um ein Vielfaches schneller als alle vergleichbaren Lösungen mit gleicher Funktionalität auf dem Markt.
FPGA als Wettbewerbsvorteil
Um jede Art von Latenzen zu vermeiden, hält Ramsan die Verarbeitung auf den Flashzellen in einer separaten Pfadstruktur, über die ausschließlich DMAs (Direct Memory Access) durchgeführt werden. Write-Set-ups, Garbage-Collection, System-Health-Calculation, Formatting, Statistic-Collections, Error-Handling und alle anderen »Nebenjobs« werden außerhalb dieser Verarbeitung in getrennten PowerPC-Einheiten durchgeführt. Ramsan ist durch die FPGA-Basis (Field Programmable Gate Array) flexibel anpassbar, wenn dies aufgrund einer geänderten Chip-Technologie notwendig werden sollte. Später in diesem Jahr sollen beispielsweise 24-nm-Chips kommen, und man darf gespannt sein wie lange es dauert, bis ASIC-basierende Lösungen diese neuen Chips integrieren können. Kommt also solch eine neue Chip-Generation, ist sie sofort in Ramsan integrierbar. Dafür ist FPGA wichtig. Mit einer ASIC-Architektur wie bei anderen Herstellern kann das Monate, gar Jahre dauern und der Wettbewerbsvorteil der neuen Chips ist dahin.
DRAM dient im Ramsan einerseits als den Flash-Zellen vorgelagerter Schreib-Cache. Hierdurch werden die Schreiboperationen mit 25 µ deutlich schneller als die lesenden. Darüber hinaus speichern andere DRAMs die Lookup-Tables. Jede Flashkarte ist mit einem bis vier PowerPC-Chips als Controller bestückt, von denen jeder 20 Flashchips im 2x9+1-RAID steuert und bis zu 40 parallele DMAs durchführen kann. Das größte Modell Ramsan 820 mit 80 dieser Controller kann also 3.200 parallele DMAs prozessieren.
Fazit
IBM spielt mit seinen erworbenen Ramsan-Modellen ganz klar in der oberen Liga der Flash-Anbieter bzw. der Full-Flash-Array-Hersteller. Dabei scheint es sich gelohnt zu haben, den Markt genau zu beobachten und nicht gleich die ersten aufstrebenden Ansätze mit blindem Aktionismus zu verfolgen. Die vier derzeit verfügbaren Systeme sind auch nur der Anfang und stellen eine hochleistungsfähige technische Basis dar, auf der Big Blue nun aufbauen muss. Die Integration in bestehende und künftige Lösungen wird hier Kernfokus sein. Ein Anfang ist bereits mit dem »Storwize V7000« gemacht, das Ramsan-Modelle ansprechen kann.
Die bestehenden Arrays bieten auf jeden Fall hohe Performance und sehr geringe Antwortzeiten und eignen sich so für alle transaktionsreichen Anwendungen, das HPC-Umfeld oder Datenbanken mit hohen Zugriffszahlen. Dabei liegt die Leistungsmesslatte für andere Hersteller recht hoch. Ebenso der Preis, was für diese Lösung aber nicht verwunderlich ist. Laut Liste ist das kleinste Modell mit einer Kapazität von fünf TByte, zwei 8-Gbit/s-FC-Interfaces, einer Fault-Tolerant-Flash-Karte und Funktionen wie LUN-Masking für rund 210.000 US-Dollar zu haben. Das Modell 820 mit 20 TByte nutzbarer Kapazität kostet rund 434.000 US-Dollar.
Hersteller: IBM Deutschland GmbH
D-70548 Stuttgart
Tel. 070 32/154 90 04
Fax 070 32/15 33 01
Web: IBM Storage
Preis (netto): ab ab ca. 210.000 US-Dollar (Listpreis für 710-Modell mit fünf TByte)
Garantie: 3 Jahre
Technische Details
Speicherkapazität: 1-20 TByte (nutzbar)
Speichermedium: SLC Flash (Modell 710)
Anschlüsse: 2x 8-Gbit/s-FC (pro Karte), 2 40-Gbit/s-Infiniband-Kanäle pro Karte/vier Links möglich (Modell 710)
Erweiterungsslots: zwei (Modell 710)
Unterstützte LUNs: bis zu 1.024 (Modell 710)
Max. Bandbreite: bis zu 5 Gbit/s (Modell 710)
Lese-Performance: bis zu 400.000 IOPS (Modell 710)
Lese-Latenz: 175 Mikrosekunden (Modell 710)
Schreib-Performance: bis zu 400.000 IOPS (Modell 710)
Schreib-Latenz: 35 Mikrosekunden (Modell 710)
Management-Support: SSH, Telnet, Browser, SNMP
Form-Faktor: 1U Rackmount
Plus
+ geringe Antwortzeiten
+ hohe IOPS
+ bis zu 20 TByte nutzbarer Kapazität
- die kleinen Systeme (710 und 810) sind nicht hoch verfügbar
- für Funktionalität benötigt man beispielsweise einen SVC