PCIe die beste Schnittstelle für Enterprise-SSDs
Enterprise-Server und -Speicher fordern eine schneller Performance, IOs und Workloads. Flash ist zwar die Lösung, noch fehlt es aber an Standards. Ralph Schmitt, CEO bei OCZ Storage Solutions, erklärt im Interview warum NVMe hier Abhilfe schafft und PCIe die beste Schnittstelle für Enterprise-SSDs ist. Zudem gibt er einen Einblick in die OCZ-Strukturen nach der Übernahme durch Toshiba.
Flash hat sich in Enterprise-Servern und Storage-Systemen bereits mehr oder weniger etabliert. Noch fehlt es aber an einheitlichen Standards. Dies soll sich mit der NVMe-Spezifikation (Non-Volatile Memory Express) ändern. Welchen Stand hat die Technologie und welche Vorteile bietet sie?
Ralph Schmitt, CEO, OCZSchmitt: Es gibt mehrere gute Schnittstellen für Enterprise-SSDs, doch PCIe hat sich als eine der besten erwiesen. Die direkte Verbindung mit der Host-CPU bietet minimale Latenzzeiten. Die aktuelle PCIe-3.0-Version ermöglicht bis zu 1 Gbit/s Bandbreite pro Lane, sodass die PCIe SSDs 4 oder 8 Lanes gleichzeitig nutzen können, womit jedes Gerät eine Bandbreite von 4 oder 8 Gbit/s erreicht.
Heutige Enterprise-Server haben mehrere PCIe-Slots für den SSD-Einsatz und können je CPU bis zu 40 Lanes einsetzen. Ein Server mit zwei Sockeln kann 80 PCIe-Lanes unterstützen. Durch den anhaltenden Leistungsunterschied zwischen Server-Prozessoren und den Disk-Arrays sind PCIe-SSDs äußerst beliebt und stellen für die nächsten fünf Jahre eine globale, schnell-wachsende Multi-Milliarden-Dollar-Möglichkeit dar. Derzeit Zeit befindet sich die Nutzung noch in der Anfangsphase.
Um das erwartete Nutzungsniveau zu erreichen, benötigte PCIe einen Host-gesteuerten Interface-Standard. Ohne diesen Standard muss jeder SSD-Anbieter eigene Treiber als Schnittstelle zwischen der SSD und dem Host entwickeln. Durch die Schnittstellen-Standardisierung ist nur ein einziger Treiber erforderlich. Daher wurde die NVMe-Spezifikation erstellt, um das volle Potenzial für Enterprise- und Client-Plattformen zur Unterstützung von PCIe-basierten SSDs zu ermöglichen.
Die NVME ist ein topaktuelles Thema, das erst in den Anfängen steckt. Wir glauben, dass die Zukunft PCIe/NVMe gehört, deshalb konzentrieren sich unsere Entwicklungen auf Innovationen in diesem Bereich. Mit dem Aufkommen von Cloud-Computing, Big Data, Virtualisierung und Mobilität, durchlebt die Datenspeicherung eine ganz eigene Metamorphose. Dies führte dazu, dass auf NAND-Flash basierte SSDs, zu den wichtigsten Speicherschnittstellen wurden. Dies wiederum führte zu einer Schwächung des Festplattenmarkts. Wir steuern diesen Übergang von Festplatten zu SSDs, indem wir anwendungsspezifische Lösungen anbieten. Flash-basierte Speicher- und Software-Lösungen bieten eine gesteigerte Performance und Reaktionsfähigkeit für ein breites Spektrum an Nutzungsmodellen und Workloads, von Virtualisierung über große Rechenzentren bis zu Cloud-Computing.
Unsere SSDs sind konzipiert, um die Speichertechnologie vorwärts zu bringe, indem konsequent daran gearbeitet wird, Speicherineffizienzen zu eliminieren. Wir glauben fest an die Verschmelzung der zwei Hauptfaktoren in unseren Lösungen — der Kosten und der Performance. Mit anderen Worten: Wir erfüllen die Performance-Anforderungen in einer kosteneffizienten Weise und steigern die Benutzerfreundlichkeit. Im Bereich Performance mit Kosteneffizienz zu vereinen, können wir auch auf unsere Erfahrung aus dem High-Performance-Computing und Gaming verweisen. Dort ist es sehr wichtig, Performance mit geringen Ausgaben zu erreichen.
Erschwingliche Performance-Steigerung in der Praxis
Können Sie uns ein Praxisbeispiel nennen?
Schmitt: 888.com, einer der weltweit beliebtesten Online-Gaming-Anbieter, sah sich mit seinem traditionellen Rechenzentrum und Netzwerk mehreren I/O-Engpässen ausgesetzt. Da mehrere Spieler auf die Ressourcen zur selben Zeit zugreifen, bestand die größte Herausforderung darin, den Datenbank-IO-Druck auf das SAN zu reduzieren und die Performance der SQL-Server-Datenbank zu verbessern. Wir haben ihr Speichersystem mithilfe unseres PCIe-basierten ZD-XL-SQL-Accelerators vereinfacht. Die IO-Belastung auf das SAN hat sich um 50 Prozent reduziert, wodurch sich der Workload-Druck verringert und die Effizienz der Anwendungsdaten erhöht wurde. So konnten die Engpässe begrenzt und den SQL-Server-Datendurchsatz um 150 Prozent verbessert werden.
Wurde NVMe nur für PCIe-SSDs entwickelt oder werden wir die Technik auch in 2,5-Zoll-Laufwerken antreffen?
Schmitt: Die bisher für SSDs verwendeten Schnittstellen (SATA, SAS, Fibre-Channel) sind für Spinning-Laufwerke bestimmt. Da sich die SSD-Technologie seit Jahren ständig weiterentwickelt, sind HDD-Schnittstellen für Flash-basierten Storage mittlerweile ineffizient. Mit NVMe steht SSD-Entwicklern das erste Mal eine standardmäßige, auf Flash beschränkte Host-Controller-Schnittstelle zur Verfügung, die von einem Industriekonsortium unterstützt wird und große Datenmengen in Hochgeschwindigkeit verarbeitet.
NVMe ist eine skalierbare Host-Controller-Schnittstellenspezifikation für SSDs auf einem PCIe-Bus innerhalb von Enterprise- und Client-Systemen. Die Spezifikation wird ständig weiterentwickelt und von einem Industriekonsortium mit mehr als 90 Mitgliedern unter der Führung der 13-köpfigen Firmengründergruppe koordiniert. Die anfängliche NVMe 1.0-Spezifikation wurde im März 2011 veröffentlicht. Die aktuelle NVMe-Spezifikation ist Version 1.1, die im Oktober 2012 veröffentlicht wurde.
NVMe ist leistungsorientiert, strukturiert und bietet ein rationalisiertes sowie optimiertes Register-Interface- und Befehlsset, das nur die Mindestanzahl der CPU-Clocks pro I/O benötigt. Das ermöglicht einen schnelleren Zugang zu kritischen Daten auf mehreren Kernen, geringere Latenzzeiten und einen reduzierten Energieverbrauch. Zudem werden aktuelle und zukünftige Speicheransprüche durch massiven Parallelismus und hohe Skalierbarkeit erfüllt.
Der Standard unterstützt auch 2,5 Zoll-Formfaktoren, sodass NVMe-basierte PCIe-SSDs bei auftretenden Fehlern bei laufendem Betrieb gewechselt werden können. Dazu wird das Laufwerk einfach aus dem Server-Gehäuse gezogen, ohne dass man den Server abschalten muss. Diese Hotswap-Fähigkeit bietet gegenüber PCIe-Edge-Cards einen bedeutenden Vorteil, da bei PCIe-Edge-Cards der Server heruntergefahren und neu gestartet werden muss, um fehlerhafte Karten auszutauschen.
Der NVMe-Standard ist im Rahmen von High-Availability (HA) auch Dual-Port-fähig. So sind im Fall eines plötzlichen Stromausfalls oder Systemabsturzes zwei redundante Datenpfade verfügbar: Fällt ein Datenpfad aus, setzt der verfügbare Datenpfad den Betrieb fort.
NVMe-Funktionsweise und die T10-Spezifikation
Wie genau, darf man sich die generelle Funktionsweise von NVMe vorstellen?
Schmitt:Enterprise-I/O-Anfragen laufen lange Zeit durch die Hardware-Infrastruktur (z.B. NAND-Flash Media, Flash-Controller, Host-Bus-Controller), da sie nur kurz im Software-I/O-Stack verarbeitet werden. NVMe arbeitet mit einem rationalisierten Stack, der die Stack-Latenzzeiten reduziert und bedeutend mehr Befehle per Warteschlange ausführen kann als andere Legacy-Protokolle. Das SAS-Protokoll kann 254 Befehle pro Warteschlange verarbeiten während SATA nur 32 unterstützt. NVMe unterstützt 64.000 Befehle pro Warteschlange und 64.000 Warteschlangen, womit ein extrem schneller Hardware-Betrieb möglich ist.
In einem veröffentlichten Test reduzierte der Linux NVMe-Software-Stack im Vergleich zu einem SCSI/SAS-Software-Stack den Software-Overhead um mehr als 50 % (von 6 µs auf 2,8 µs) und die Anzahl der Befehlszyklus von 19.500 auf 9.100.
Wie ist es um den Datenschutz bestellt? Laut Spezifikation nutzt NVMe ein Datenintegrationsfeld (DIF). Was ist das genau?
Schmitt: Hier bildet T10 die Basis: Dabei handelt es sich um einen Ausschuss des »International Committee for Information Technology Standards« (INCITS), der sich mit der SCSI-Schnittstelle befasst.
- T10-DIF (Data Integrity Feature): Es wurde ursprünglich von T10 für die SCSI-Schnittstelle eingeführt und unterstützt nur 512b + 8b Sektoren. Dabei wird jedem Sektor eine Prüfsumme an einem bestimmten Punkt im Storage-Stack hinzugefügt (HBA für SCSI – OS für NVMe). Wenn die Prüfsumme einmal geschrieben oder gelesen wurde, kann sie neu errechnet und mit dem Original verglichen werden. Das zeigt, ob sich die gelesenen oder geschriebenen Daten von den erwarteten Daten unterscheiden. Diese Metadaten können Host-abhängig (DIF) oder Laufwerks-bezogen (optional in PI) sein.
- T10-PI (Protection Information): Eine Erweiterung von T10-DIF zur Unterstützung zusätzlicher Sektorgrößen.
- T10-DIX (Oracle Data Integrity Extensions): Verfügt über mehr Funktionen, wie OS-Zugriff auf Metadaten für vollen E2E-Schutz.
Unsere »Z-Drive 6000«-Serie unterstützt beispielsweise bis zu T10-PI.
Die ersten OCZ-SSDs auf NVMe-Basis
Mit der »Z-Drive 6000« PCIe-Serie hat OCZ die ersten NVMe-basierten Produkte vorgestellt. Ab wann sind die SSDs verfügbar? Was leistet die neue Serie und für welche Einsatzszenarien und Kundenkreise ist sie gedacht?Schmitt: Beim Z-Drive-6000-Portfolio kommt die NVMe-Technologie zum Einsatz, mit deren Hilfe der Storage-+Stack optimiert und die Protokolllatenz verkürzt werden können. So wird die Performance und Effizienz im Vergleich zuden vorherigen Z-Drive-Generation gesteigert. Die Bandbreite von PCIe Gen 3 ermöglicht nachhaltige Übertragungsgeschwindigkeiten von bis zu 2,9 Gbit/s und bis zu 700.000 IO-Anfragen pro Sekunde. Die 6000er-Serie gewährleistet außerdem konsistente und voraussagbare Niedriglatenz-IO-Reaktionen von nur 25 Mikrosekunden bei einem 4-KByte-Schreibvorgang und 80 Mikrosekunden bei einem 4-KByte-Lesevorgang.
Die SSDs eignen sich für rechenintensive, analytische, Online-Transaktions- sowie Cloud-basierte Enterprise-Anwendungen, die ein hohes Performance-Niveau und I/O-Reaktionen mit kurzen Latenzzeiten erfordern. Zudem bietet es Funktionen, die massive Parallelität und hohe Skalierbarkeit begünstigen, um derzeitige und zukünftige Speicheranforderungen erfüllen zu können. Die NVMe-konforme Z-Drive-6000-Serie ist in verschiedenen Konfigurationen verfügbar, die eine ganze Reihe von Formfaktoren, Speicherkapazitäten und Haltbarkeitswerten unterstützen.
Geplante Eigenschaften sind die Unterstützung der Dual-Port-Funktionen, mit deren Hilfe zwei Host-Systeme auf dasselbe Gerät gleichzeitig zugreifen können oder die Redundanz innerhalb desselben Hosts gewährleisten. Falls es bei einem Systemausfall zu einer Beschädigung eines Datenpfades kommen sollte, bleibt der verfügbare Datenpfad mithilfe des zweiten Ports ohne Abschwächung der Service-Qualität in Betrieb – so als hätte es keinen Systemausfall gegeben. Darüber hinaus werden Hot-Swapping von 2,5-Zoll-Laufwerken unterstützt sowie voreingestellte Leistungsgrenzen und Temperaturdrosselung.
NVMe hebt PCIe-Flash auf eine neue Ebene
Wie verändert Flash aus Eurer Sicht Speichersysteme, wie wir sie bisher kennen? Mit welcher mittelfristigen Entwicklung sollten IT-Manager und Unternehmen rechnen?
Schmitt: Mit der NVMe-Spezifikation wird der herkömmliche PCIe-Flash-Speicher auf eine neue Ebene gehoben. NVMe wurde von Grund auf dazu konzipiert, die spezifischen Vorteile des nichtflüchtigen speicherbasierten Solid-State-Storage zu aktivieren. Speicherschnittstelle, Befehlssatz und Warteschlangen-Design wurden optimiert und bieten einen schnelleren Zugriff auf kritische Daten sowie einen äußerst widerstandsfähigen Speicher. Systemherstellern und Speicherlieferanten ist es nun möglich, verschiedene Teile eines Speicherökosystems unter Einhaltung einer Standard-Spezifikation mit umfassender Interoperabilitätsunterstützung zwischen Speichergeräten, Host-Plattformen und Software zu entwickeln. NVMe soll neue Möglichkeiten für schnellere, bessere und stärkere flashbasierte Speicheranwendungen eröffnen und den PCIe-SSD-Einsatz innerhalb der nächsten fünf Jahre wesentlich verbessern.
OCZ bleibt trotz Übernahme relativ eigenständig
Können Sie uns noch mehr über die aktuelle Geschäftsstrategie verraten? Was hat sich durch die Übernahme von Toshiba verändert?
Schmitt, CEO, OCZ: »Toshiba unterstützt unsere Unabhängigkeit.«Schmitt: In den letzten zwei Jahren hat OCZ viele Veränderungen erlebt. Höhepunkt war dabei die Übernahme von Toshiba für 35 Millionen US-Dollar. Seitdem ist OCZ Storage Solutions eine eigenständige Tochtergesellschaft der Toshiba-Gruppe. Entgegen üblichen Übernahmefolgen, wurden die Abteilungen von OCZ (wie u.a. Marketing und Produktentwicklung) nicht in Toshiba integriert, sondern blieben erhalten. Die Beziehung von Toshiba und OCZ sieht eher aus, wie eine strategische Partnerschaft und die Separierung macht Sinn.
Toshiba unterstützt unsere Unabhängigkeit, um das Talent des Unternehmens nicht in der massiv strukturierten Organisation zu verlieren sondern zu bewahren. Eines der größten Probleme bei einer Übernahme ist, dass das Mutterunternehmen nicht alle Talente und Ressourcen der Tochtergesellschaft aufgrund kultureller Unterschiede der jeweiligen Organisation nutzen kann. Individuelle Begabung ist letztlich nichts Konkretes und kann daher auch nicht wie Geld von einem zum anderen Ort übertragen werden. Es gilt verschiedene ökologische und kulturelle Faktoren zu berücksichtigen. So kann beispielsweise die Integration einer liberalen und entspannten Unternehmenskultur in eine straff geführte Organisation bestimmte Persönlichkeiten hindern sich zu äußern, da die Arbeitsweise nicht zu ihnen passt.
Glücklicherweise begegnete uns Toshiba in Augenhöhe und erkannte, dass wir nicht die Zeit und die Ressourcen hatten, um das volle Potential zu realisieren. Daher ermöglichte uns Toshiba mit finanzieller Unterstützung, OCZ weiterhin als separate Einheit zu führen. Der Aktionsplan sieht eine nachhaltige Entwicklung vor. Zusätzlich haben beide Unternehmen eine Vereinheitlichung der Produktentwicklungsstrategie vereinbart. Zu Beginn gab es Überschneidungen, bei denen beide Unternehmen versuchten so viele Märkte wie möglich mit den jeweiligen Produktlinien abzudecken. Ab Mitte 2015 jedoch sollte sich das angepasst haben. Wir stoppten beispielsweise die Weiterentwicklung von Produkten mit der SAS-Schnittstelle, da Toshiba hier über mehr Know-how verfügt. Auch im OEM-Bereich hat Toshiba mit bestimmten Laufwerken eine starke Präsenz. Andererseits haben wir ein umfangreicheres Einzelhandelsnetz und wird sich hier auf SATA- und PCIe-Laufwerke konzentrieren. Die allgemeine Idee soll sein, jeden Bereich zu vervollständigen und nicht zu konkurrieren.
Wie hat sich die Marktsituation für OCZ seit der Übernahme von Toshiba verbessert?
Schmitt: Als Teil der Toshiba-Gruppe haben wir nun den Vorteil auch eine Reihe von Toshiba-Testeinrichtungen nutzen und damit noch umfangreichere Tests während des kompletten Design-Zyklus durchführen zu können. So kann mit spezialisierten Tests und Validierungen sichergestellt werden, dass spezifische Kundenanforderungen erfüllt werden. In der frühen Phase der Übernahme haben beide Unternehmen unterschiedliche Philosophien bei der Validierung verfolgt, was angesichts der unterschiedlichen Kulturen logisch war. So konzentrierte sich Toshiba mehr auf Tests für NAND-Flash (Toshiba ist der Erfinder und führende Anbieter von NAND-Flash), während wir uns auf andere Aspekte wie Controller und Firmware fokussieren.
Beide Unternehmen mussten sich daher zuerst annähern und die gleiche Denkweise bei der Entwicklung und Prüfung von Produkten übernehmen. Toshiba übernimmt die gleichen Qualitätsstandards für OCZ-Laufwerke wie für die eigenen. Wir haben somit einige Prozesse der Qualitätskontrolle von Toshiba übernommen. Das ist nur ein Beispiel dafür, wie sich die beiden Unternehmen nun ergänzen. Beide Unternehmen sind noch immer in einem Lernprozess, mit dem Ziel am Ende die bestmöglichen Produkte auf den Markt zu bringen.
Der wichtigste Vorzug für uns stellt der Zugriff auf die NAND-Flash-Expertise von Toshiba dar. Im weitesten Sinne ist NAND ein einfacher Halbleiter mit sehr viel komplexer Technologie im Hintergrund. Einige OCZ-Ingenieure durften einige Zeit in Japan verbringen, um die NAN-Flash-Technologie zu verstehen und somit bessere Produkte zu entwerfen. Vor allem für die Optimierung der Ausdauer, erfordert ein tiefes Verständnis für NAND-Flash. Der Zugang zu diesem Wissen, sowie dessen Anwendung zur Gestaltung künftiger Produkte ist ein wichtiger Marktvorteil für uns.
Ein ebenfalls großer Vorteil für uns ist die künftig konstante Lieferung von Toshiba-NAND-Speicher. Davor mussten wir diesen auf dem freien Markt beschaffen. Daher konnte die Qualität variieren. Wie viele andere Komponenten (wie auch Waren und Güter im Allgemeinen) wird NAND-Flash auf dem Spotmarkt gehandelt, auf dem jeder kaufen und verkaufen kann. Hat ein NAND-Hersteller Überschussbestände, verkauft er sie auf dem Spotmarkt zum aktuellen Tagespreis. Manchmal kann der Käufer den NAND-Speicher direkt vom Hersteller erstehen, doch die erforderlichen Volumen und damit die Bargeldbindung sehr hoch. Angebot und vorhersehbare Nachfrage werden mit Preisänderungen verknüpft, so dass dies nicht sehr profitabel ist.
Forschung & Entwicklung ziehen an einem Strang
Und wie hat sich in diesem Rahmen Ihre F&E-Abteilung entwickelt?
Schmitt:Ich würde uns als »All-Inclusive«-Lösung für anspruchsvolle Speicheranforderungen sehen. Wir kontrollieren alle Technologieaspekte. Unsere Flexibilität, Lösungen auf allen Ebenen der Wertschöpfungskette den Wünschen unserer Kunden anzupassen, ermöglicht uns einen Vorsprung in diesem umkämpften Markt. Mit Toshiba werden wir Produkte der nächsten Generation verwirklichen.
Neben der Zusammenarbeit auf Strategie-Ebene, wird auch auf Produktebene kooperiert. Toshiba wird sich auf die Entwicklung von SSDs mit TLC-NAND fokussieren. Die Entwicklungen hierzu schreiten voran. Tatsächlich ist ein großes Wissen bezüglich NAND-Technologie notwendig, um wettbewerbsfähige TLC-Speicher zu entwickeln. Es scheint offensichtlich, dass sich alle Ressourcen auf ihre Plattform konzentrieren, statt unabhängig voneinander das gleiche Ziel zu erreichen. Zum ersten Mal wird nun dieses TLC-Drive auch unter der Marke von OCZ im Markt erscheinen.
Im Gegenzug ist Toshiba sehr an unserer der nächsten Controller-Generation »JetExpress« interessiert und wird OEM-Modelle damit ausstatten. Unser Fertigungsbetrieb wurde bei einem zertifizierten Partner von Toshiba (PTI) integriert. Ein Team erfahrener Ingenieure bieten ein innovatives geistiges Eigentum hinsichtlich Design und Entwicklung von Flash-Speicherlösungen. Selbstverständlich ist die Qualität auch hier ISO 9001-Kompatibel.
Wir sind heute bestrebt eine ausgewogene Mischung aus Qualität und Leistung zu erreichen, um Kunden diese überlegene Zuverlässigkeit zu gewährleisten. Qualität hat Priorität im gesamten Unternehmen. Dafür haben wir erhebliche Investitionen getätigt und enorme Fortschritte gemacht. Damit haben wir die Rate für fehlerhafte Produkte erfolgreich reduziert und verbessern sie weiterhin. Unsere aktuellen Produktlinien haben eine Rücklaufquote von insgesamt nur 0,57 Prozent (Produkte, die bis zum 30. April im Einsatz waren). Davon haben sich 0,43 Prozent als wirklich defekt erwiesen. Das heutige Unternehmen OCZ unterscheidet sich sehr von dem gestrigen. Das Management hat den Grundstein für eine nachhaltige und langfristige Entwicklung, sowie eine ordnungsmäßige Validierung gelegt.