Anzeige

»Data Genomics Index« von Veritas: So speichern die Unternehmen

Das Softwarehaus Veritas Technologies hat mit dem »Data Genomics Index« ein interessantes Projekt gestartet. Daraus lässt sich unter anderem erkennen: Wie speichern Unternehmen ihre Daten eigentlich? Wie verändert sich die Datenzusammenstellung? Und welche Daten werden eigentlich wie oft gebraucht? Der Echtzeit-Einblick gibt einen interessanten Einblick – mit überraschenden neuen Erkenntnissen.

Mit dem Zugriff auf Milliarden von Metadaten entsteht der »Data Genomics Index« (Bild: Veritas Technologies)Mit dem Zugriff auf Milliarden von Metadaten entsteht der »Data Genomics Index« (Bild: Veritas Technologies)Mit dem neuen Daten-Genom-Projekt will Veritas Technologies weltweite Business-Datentrends untersuchen. Mit dem Index macht Veritas den ersten Schritt, um Datenumgebungen in Unternehmen zu indexieren und die gespeicherte Anzahl an Daten messbar zu machen. Damit will Veritas das Interesse für diese wachsende Herausforderung wecken – und Organisationen dazu bewegen, ihr entgegenzutreten.

Eine der Erkenntnisse des Echtzeit-Einblicks in die Daten ist beispielsweise, dass in Unternehmen mehr als 40 Prozent der Dateien in den letzten drei Jahren nicht verwendet wurden – eine Erkenntnis auf deren Basis Unternehmen beispielsweise in großem Umfang Kosten reduzieren könnten.

Der Datengenom-Index ist der erste Bericht, der genaue Erkenntnisse zur aktuellen Datenumgebung in Unternehmen bietet. Daher kann er für nachfolgende Studien als Vergleichsmaßstab dienen. Organisationen können auf Basis dieser Informationen intelligente Maßnahmen und Korrekturen einführen, wo sie den größten Nutzen bieten.

Anzeige

Entwicklerdateien dominieren den Speicherbedarf

Entwickler generieren die meisten Dateien, aber Bilder belegen den meisten Speicherplatz (Bild: Veritas Technologies)Entwickler generieren die meisten Dateien, aber Bilder belegen den meisten Speicherplatz (Bild: Veritas Technologies)Der Index zeigt auch, dass Bilder, Entwicklerdateien und komprimierte Daten fast ein Drittel der gesamten Umgebung ausmachen. Gemessen an der reinen Zahl der Dateien machen Entwicklerdateien 20 Prozent der Gesamtmenge aus. Dagegen hat sich In den letzten zehn Jahren der Anteil von Präsentationen im Vergleich zu anderen Dateitypen hingegen um 500 Prozent reduziert. Der Trend zeigt deutlich, dass die Dominanz von PowerPoint endlich gebrochen ist.

Interessant auch die saisonale Datengenerierungs-Komponente: Der Herbst dominiert im Hinblick auf die Erstellung von Dateien: Es werden 91 Prozent mehr Textdateien, 48 Prozent mehr Tabellenkalkulationen und 89 Prozent mehr Systemdateien für Speicherorte und Informationen produziert. Anscheinend nehmen wir die meisten Videos im Sommer und Herbst auf – und diese Privatdateien wandern dann auf Unternehmensspeicher: Die Zahl der Videos steigt in diesen Jahreszeiten um 68 Prozent.

Massen von »abgelaufenen« und »verwaisten« Daten

41 Prozent der Daten wurden in den letzten drei Jahren nicht mehr verändert (Bild: Veritas Technologies)41 Prozent der Daten wurden in den letzten drei Jahren nicht mehr verändert (Bild: Veritas Technologies)Mit der Ausnahme von regulatorischen oder Compliance-Anforderung sind drei Jahre normalerweise der Zeitraum, nach dem potenziell relevante Dateien nicht mehr aktuell sind. Der Report zeigt, dass 41 Prozent der Daten einer durchschnittlichen Umgebung in den letzten drei Jahren nicht verändert wurden und damit »abgelaufen« sind. Mutige Unternehmen könnten eigentlich daran gehen, dies nun zu löschen.

Neben den »abgelaufenen« Daten gibt es noch verwaiste Daten, die keinen aktuellen »Eigentümer« mehr haben. Dieser hat entweder seine Rolle im Unternehmen gewechselt oder hat es verlassen. Unternehmen verlieren diese Daten oftmals aus dem Sinn, sie kosten aber viel Geld. Der Index zeigt, dass verwaiste Daten oft Videos, Bilder und Präsentationen sind – reichhaltige Inhalte, die eigentlich nicht unbeachtet bleiben sollten. Sie nehmen zudem einen hohen Anteil an Speicherplatz ein – und zwar laut Genom-Index über 200 Prozent mehr, bezogen auf die gezählte Anzahl der gesamten Dateien.

Speicherkosten: kleine Änderungen, große Effekte

Löschen oder ein Archivierungsprojekt kann erhebliche Kosteneinsparungen bewirken (Bild: Veritas Technologies)Löschen oder ein Archivierungsprojekt kann erhebliche Kosteneinsparungen bewirken (Bild: Veritas Technologies)Mit ähnlichen Einsichten in ihre Daten können Organisationen Bereiche priorisieren und signifikante finanzielle Vorteile erzielen. Traditionelle Office-Formate wie Präsentationen, Tabellenkalkulationen und Dokumente nehmen aufgrund ihres Alters mehr Platz ein, als sie eigentlich benötigen. Dies führt zu hohen Kosten. Visuelle Formate wie Videos und Bilder belasten die Unternehmen ebenfalls sehr.

Der Fokus sollte laut Veritas deshalb darauf liegen, Daten entsprechend zu archivieren, zu löschen und zu migrieren. Der durchschnittliche Speicherbedarf in Unternehmen liegt bei zehn PByte. Ein Archivierungsprojekt, das sich ausschließlich auf veraltete Daten bezieht, kann daher zu Einsparungen von jährlich bis zu zwei Millionen US-Dollar sorgen.

»Von unseren Kunden hören wir, dass sie mit zwei unterschiedlichen Naturgewalten konfrontiert werden: dem exponentiellen Datenwachstum sowie begrenzten Ressourcen und Budgets, um der Datenflut mit neuen Servern oder Anwendungen Herr zu werden«, erklärt Steve Vranyes, CTO bei Veritas. »Wir setzen das einzigartige Verständnis von Veritas über wichtige Metadaten-Eigenschaften ein, um eine genaue Repräsentation einer durchschnittlichen Datenumgebung zu erstellen. Diese Einblicke werden die Wachstumsdynamik verändern, die wir derzeit beobachten.«

Veritas plant Community und Forum rund um das Data-Genomics-Projekt

Der Data-Genomics-Index ist die erste Studie, die einen Vergleichsindex mit präzisen Details von echten Datenumgebungen erstellt – von der Dateizusammensetzung über das durchschnittliche Alter bis hin zu den Größenverhältnissen der einzelnen Dateien. Veritas möchte dazu auch eine Community und ein Forum bzw. mit dem Data-Genomics-Projekt die erste Forschungsinitiative ihrer Art ins Leben rufen. Unternehmen sollen dadurch die Art ihrer Daten besser verstehen.

Der Data-Genomics-Index ist der erste Beitrag dazu. Das Projekt soll Datenwissenschaftler, Industrieexperten und Meinungsführer zusammenbringen, um das Information-Management-Genom zu entschlüsseln. Teilnehmer teilen ihre Forschungsarbeiten und diskutieren weltweit mit Unternehmen, die Schwierigkeiten haben, die zunehmenden Herausforderungen beim Datenwachstum zu lösen. Veritas ist Gründungsmitglied und wirkt an dem Projekt mit; es wird aber betont, dass es kommerziell vom Geschäft des Unternehmens getrennt ist.

.
Anzeige