All-Flash als schnelle Datenplattform für KI
Der Erfolg hat zwei Seiten: KI dank effizientem Flash-Speicher bzw. effizienteres Flash-Storage dank KI. All-Flash-Pionier Pure Storage ermöglicht mit »FlashBlade« anspruchsvolle KI-Anwendungen und nutzt selbst künstliche Intelligenz für effizientere Flash-Storage-Umgebungen. Nur mit ausreichender Geschwindigkeit und Intelligenz lässt sich das Datenaufkommen im Unternehmen nutzbringend beherrschen.
Markus Grau, Pure Storage
Im Vollausbau bietet ein ≫FlashBlade≪-System von Pure Storage bis zu acht PByte an Speicherkapazität (Bild: Pure).Da immer mehr Unternehmen die Digitalisierung vorantreiben, wächst das Datenvolumen mit enormer Geschwindigkeit. Indem sich die Datenerzeugung zunehmend vom Menschen zur Maschine verlagert, generiert von Sensoren, IoT-Geräten, Digitalkameras und unzähligen vernetzten Geräten, explodiert das Datenvolumen geradezu. Eine aktuelle Prognose von IDC geht davon aus, dass im Jahr 2025 das generierte Datenvolumen 180 ZByte erreichen wird. Zum Vergleich: Im Jahr 2015 waren es weniger als zehn ZBytes.
Aus dieser Datenflut lassen sich wertvolle Erkenntnisse gewinnen, was Daten zur wertvollen Geschäfts-Ressource macht. Gleichzeitig verändert sich die Datenanalyse. Herkömmliche Methoden verlieren an Boden zugunsten von künstlicher Intelligenz (KI), maschinellem Lernen (ML) und Deep-Learning, neuronalen Netzwerken und Echtzeit-Datenstromanalytik. Bedarf dafür besteht in einer Vielzahl von Branchen. Die Automobilindustrie liefert sich ein Rennen im Bereich des autonomen Fahrens, wo maschinelles Lernen eine zentrale Aufgabe übernimmt. Im Finanzbereich dienen KI und ML der Risikoanalyse sowie der Automatisierung von Kapitalflüssen und Investments. Genanalysen werten komplexe Daten aus, um Ärzte dabei zu unterstützen, rasch zuverlässige Diagnosen zu stellen.
Schnelle Verfügbarkeit der Daten ist entscheidend
Moderne Analytik hängt jedoch maßgeblich von den verfügbaren Daten und deren Verarbeitung ab. Immense Mengen an Daten müssen in extrem hoher Geschwindigkeit an superschnelle, parallel arbeitende Hochleistungsprozessoren (Multicore-CPUs und -GPUs) übertragen werden. Für Deep-Learning und Data-Science kommen die weltweit anspruchsvollsten IT-Umgebungen zum Einsatz. Konventionelle Speicherlösungen, basierend auf herkömmlicher serieller Block-Architektur, können jedoch nicht genügend Daten in der benötigten Geschwindigkeit zur parallelen Berechnung liefern, die bei KI-Workloads benötigt wird. Hier stoßen selbst äußerst leistungsfähige Rechenumgebungen an ihre Grenzen – und diese Grenzen liegen derzeit oft auf Seiten der Speichertechnologie. Deswegen ist ein anderer Storage-Ansatz nötig, der einen massiv-parallelen Zugriff auf Daten mit einer sehr hohen Bandbreite erlaubt.
Eine hohe Parallelität, wie sie moderne All-Flash-Arrays liefern, beseitigt diese Engpässe und ermöglicht direkte Übertragungswege zwischen Rechen- und Speicherkomponenten. All-Flash-Pionier Pure Storage ist noch einen Schritt weitergegangen und hat Anfang des Jahres eine neue Datenplattform auf den Markt gebracht: FlashBlade wurde von Grund auf mit einer hochgradig parallelen Architektur entworfen und speziell konzipiert für Anwendungen rund um KI und moderne Analytik. Das hochgesteckte Ziel war es, viele neue KI-Anwendungen überhaupt erst möglich zu machen. KI wiederum sorgt für eine effiziente, optimierte Performance der Flash-Storage-Umgebung – durch prädiktive Wartung und Automatisierung im Sinne eines »Self-driving Storage«.
Künstliche Intelligenz dank effizientem Flash-Storage
FlashBlade ist gegenwärtig der branchenweit einzige Scale-Out-Speicher, der von Grund auf speziell für KI und moderne Analytik entwickelt wurde. Ziel war es, die Zeit zur Lösung anspruchsvoller analytischer Aufgaben von Tagen auf Stunden zu reduzieren. Beim Einsatz von FlashBlade wird nur ein halbes Rack benötigt, um acht PByte an nutzbaren Daten bereitzustellen und diese mit 75 GByte/s zu lesen und mit 25 GByte/s zu schreiben. Dabei leistet das System 7,5 Millionen IOPS.
Aktuell gibt es am Markt keine Storage-Lösung, die eine vergleichbare Leistung und Effizienz liefert, um KI-Modelle zu trainieren und Deep-Learning zu ermöglichen. Seit seiner Markteinführung unterstützt FlashBlade bereits viele Unternehmen in einem breiten Spektrum von Branchen und Anwendungsfällen, darunter Automotive, Finanzwesen, Biochemie, Gesundheitswesen, Öl- und Gasindustrie, Profisport, Software-as-a-Service (SaaS) sowie prädiktive Analytik. Seit FlashBlade verfügbar ist, greifen zahlreiche Unternehmen, die hochmoderne und großvolumige Datenverarbeitung betreiben, darauf zurück.
Dazu zählt auch Zenuity, ein Joint Venture zwischen Volvo und Autoliv. Dieses Unternehmen entwickelt Software für autonome Fahr- und Fahrerassistenzsysteme. CGit, der zuständige Partner, schuf eine Lösung mit FlashBlade und NVIDIAs KI-Supercomputer DGX-1 als Grundlage für ein Deep-Learning- und ML-Projekt.
Ein weiteres Beispiel ist das Formel-1-Team von Mercedes-AMG Petronas Motorsport, dass seine hochgerüstete IT-Infrastruktur nutzt, um sich einen Wettbewerbsvorteil zu verschaffen. Hierzu werden während jedes Rennens große Datenmengen gesammelt und die Ergebnisse analysiert, um die Leistung eines Autos zu verbessern. Hier geht es um Optimierungen im Bereich von Bruchteilen einer Sekunde, die in der Formel 1 über Sieg oder Niederlage entscheiden können.
Ebenfalls genutzt wird FlashBlade von der namhaften Universität Berkeley. Das Berkeley AMPLab hat mit Apache Spark die führende Analytics-Engine für superschnelle Datenanalysen in Echtzeit entwickelt. Der Lehrstuhl für Genomik hat Apache Spark mit FlashBlade verknüpft und konnte so die Sequenzierung von Genomen sprunghaft beschleunigen.
Praktische Umsetzung von KI-Projekten als Chance für Händler
KI ist das Thema in vielen weiteren Unternehmen. Die praktische Umsetzung neuer Projekte ist vielerorts jedoch noch nicht so weit über die theoretische Erkenntnis hinaus gediehen, das Potenzial von KI & Co. möglichst bald nutzen zu müssen. Während fast neun von zehn Führungskräften glauben, dass KI einen Wettbewerbsvorteil für ihr Unternehmen bieten wird, ist bei weniger als 39 Prozent eine KI-Strategie vorhanden. Darin liegt eine hervorragende Geschäftsmöglichkeit für IT-Reseller und IT-Systemhäuser, sich als kompetente Berater für Unternehmen in der modernen, datenbasierten Wirtschaft zu etablieren.
Dem 2017er Branchenreport von Bank of America Merrill Lynch zufolge bieten Storage-Systeme, die für Big-Data, KI und ML entwickelt wurden, ein weltweites Marktpotenzial von neun Milliarden US-Dollar. Speichersysteme, die für moderne und kommende Workloads konzipiert wurden, entwickeln sich zum attraktiven Wachstumsgeschäft.
IT-Reseller und IT-Systemhäuser, die jetzt in praktisches Know-how in diesem Bereich investieren, haben sehr gute Chancen, sich von ihrer Konkurrenz abzusetzen. Dies setzt die Schulung des Vertriebs für strategische Gespräche mit Datenarchitekten oder Dateningenieuren, die in neuen Branchen das Sagen haben, voraus. Jetzt ist die Zeit, um IT-Entscheider zu beraten, die bislang herkömmliche Speichertechnologie nutzten, aber nun offen für neue Technologien sind, da sie eine innovative Datenanalytik nutzen wollen.
Ebenso wichtig aus Herstellersicht ist die Zusammenarbeit mit Distributionspartnern, die in den neuen datenintensiven Märkten aktiv sind. Mit PNY Technologies als Distributionspartner für die EMEA-Region erhält Pure Storage zukünftig breiten Zugang zu Märkten und Anwendungsfeldern, in denen KI und Analytik eine wichtige Rolle spielen. PNY Technologies ist ein führendes Unternehmen in den Bereichen High-Performance-Computing (HPC), Grafikvirtualisierung und Deep-Learning. Da hier immense Mengen an unstrukturierten Daten zur Verfügung gestellt und verarbeitet werden müssen, sieht sich Pure Storage mit FlashBlade optimal aufgestellt.
Flash-Storage wird noch effizienter dank künstlicher Intelligenz
Die KI-Engine ≫Pure1 META≪ stellt intelligente Prognosefähigkeiten zur Verfügung, indem es Daten sammelt und analysiert (Grafik: Pure).Pure Storage selbst nutzt künstliche Intelligenz und FlashBlade als Schlüsselkomponenten seiner internen Technologieplattform. Die KI-Engine Pure1 META stellt intelligente Prognosefähigkeiten zur Verfügung, indem sie Daten sammelt und analysiert, die von den Telemetriepunkten eines globalen Sensornetzwerks mit Tausenden von vernetzten Arrays geliefert werden. KI hilft dabei den Kunden, mögliche Engpässe in ihren Systemen vorherzusagen und rechtzeitig zu identifizieren.
Pure Storage spricht dabei von Self-driving Storage und sieht Parallelen zur modernen Automobilwelt: Die Autos werden immer autonomer, sie können selbst navigieren und Kollisionen vermeiden. Auch völlig autonomes Fahren ist bereits realisierbar, wobei es die nächsten Jahre zunächst weiterhin um Entwicklung, Erprobung, Optimierung, Zulassung und Haftungsfragen gehen wird. Der Trend aber ist eindeutig: Vom Park- und Spurhalteassistenten über automatisiertes Stop-and-go-Fahren ist es gar nicht mehr so weit bis zum völlig autonomen Fahren.
Die Automobilindustrie hat es also vorgemacht – und jetzt ist es an der Zeit, dass die Storage-Branche aufholt und die »selbstfahrende« Storage-Umgebung anbietet. Pure1 META nutzt bereits Big-Data- und Echtzeit-Analytik sowie fortschrittliche KI-/ML-Techniken, um die Erfahrung der Storage-Nutzer zu verbessern. Durch prädiktive Wartung und bedarfsoptimierten Support wird ein neues Maß an Zuverlässigkeit erreicht. Mit der von der KI-Engine generierten Workload-DNA können Unternehmen erstmals sowohl die Kapazität als auch Performance vorhersagen – für intelligente Workload-Implementierung, -Interaktion und -Optimierung. Dadurch lassen sich unnötige Kosten aufgrund von Überkapazitäten oder Ausfallzeiten wegen zu geringen Kapazitäten effektiv verhindern.
Der wichtigste Treiber hinter der globalen prädiktiven Intelligenz von Pure1 META ist die META AI Engine, die einen »Data Lake« mit mehr als sieben PByte Daten analysiert, um sowohl Problem-Fingerprints als auch Workload-DNS zu generieren. META scannt die gesamte eingehende Array-Telemetrie gegen eine Bibliothek von Problem-Fingerprints, um Vorfälle in Echtzeit vorhersagen und beheben zu können, bevor sie Kundenumgebungen beeinflussen. Dabei werden Hunderte von Variablen, die sich auf die Performance beziehen, erfasst und zur Vorhersage der Belastung verwendet.
Das neue Global Dashboard in Pure1 vereinfacht dabei auch das Management, indem es wichtige aggregierte Metriken aus einer ganzen Flotte von Arrays zur Verfügung stellt. Von einem einzigen Dashboard aus können sich Kunden die gesamte Datenreduktion und durchschnittliche Lastperformance für alle Arrays anzeigen lassen. Performancetrends für die letzten 24 Stunden werden auch angezeigt und Kunden können effektiver planen dank Vorhersagen des Kapazitätsverbrauchs auf allen Arrays. Aktuelle Alarme und Meldungen ermöglichen zudem eine bessere Sicht auf den Speicherplatz in der Array-Flotte.
Daten arbeiten lassen
Da immer mehr Unternehmen Anwendungen und Workloads der nächsten Generation wie Deep-Learning und Rich-Media einführen, müssen sie höhere Leistungsniveaus als je zuvor aus ihrer IT-Infrastruktur herausholen. Die neue Datenplattform FlashBlade ermöglicht es Kunden, ihre Daten arbeiten zu lassen, ohne sich um Storage-Probleme und -Engpässe kümmern zu müssen. Dank dieser einfachen Storage-Nutzung, in Kombination mit hoher Geschwindigkeit und Skalierbarkeit, hat Pure Storage die Wirtschaftlichkeit von Datenanalytik, künstlicher Intelligenz und maschinellem Lernen erheblich verbessert. Diese neuen datenbasierten Anwendungen werden somit in einem breiteren Spektrum nutzbar.
Pure Storage Germany GmbH
Mies-van-der-Rohe-Straße 6
80807 München
Tel. +49 (0)89/120 89 253
E-Mail: info@purestorage.com
Mehr zu »FlashBlade«-Lösungen von Pure Storage
MIT Sloan Management Review: Reshaping business with Artificial Intelligence