Brauchen auch KMUs einen Data Scientist?
Leserfrage: Alle sprechen von Big Data bzw. neuerdings von Smart Data. Wenn ich es richtig sehe, nutzen bereits Großunternehmen wie beispielsweise Microsoft/Facebook vermehrt Microservices, um hochskalierbare Dienste anzubieten, die in Sekunden auf herausgefilterte Ereignisse reagieren. Muss jetzt jedes Unternehmen Data Scientists beschäftigen? Was kommt da auf kleinere Unternehmen und Mittelständler zu?
Antwort Doc Storage:
Wie (fast) immer in der Informatik lautet auch hier die Antwort: »Es kommt drauf an.« Vor allem einmal auf die Definition, was überhaupt ein »kleines oder mittleres« Unternehmen ausmacht. Ist es der Umsatz, ist es die Anzahl der Mitarbeiter, die Größe der EDV oder das Volumen des installierten Speichers? Ich denke, für die Beantwortung der hier gestellten Frage sollte es (natürlich) entweder um das Volumen des installierten Speichers oder noch besser um die Anzahl der Informationen in den dort laufenden Anwendungen gehen.
Ein Data Scientist soll sich ja vor allem um die Analyse und den sinnvollen Umgang der gespeicherten Informationen kümmern. Dies wird immer dann sinnvoll, wenn größere Datenmengen (jaja, ich weiß, auch ein schwammiger Begriff) zur Bearbeitung anstehen. Aber, was sind nun größere Datenmengen? Für die eine Firma können dies schon einige Gigabyte, für ein anderes Unternehmen mehrere Terabyte, und für die Angeber unter uns Petabytes an Informationen sein. Daneben kommt es auch darauf an, wie unterschiedlich und informationshaltig die gespeicherten Daten sind. In wenigen Gigabytes hochdivergenter Daten können oft mehr Informationen enthalten sein, als in Petabytes, in denen sich ein und derselbe Block immer wiederholt.
Wenn man all dies nicht weiß, und ich gehe bei den meisten KMUs davon aus, dass die interne EDV anderes zu tun hat als sich um diese Themen zu kümmern, sollte man sich zur ersten Analyse der gespeicherten Daten Hilfe von außen holen. Es gibt genug Spezialisten, die diese Aufgabe für eine bestimmte Zeit übernehmen und dem Betreiber eine entsprechende Übersicht vorlegen. Erst dann sollte entschieden werden, ob es zum weiteren Betrieb und zum »Abernten« der gespeicherten Informationen tatsächlich einen eigenen Spezialisten im Hause braucht. Nach meinen Erfahrungen wird es aber in Unternehmen, die sowieso in der EDV auf Kante genäht sind, kaum das Budget für eigene Data Scientists geben. Hier ist es lohnenswerter, von Zeit zu Zeit externe Hilfe in Anspruch zu nehmen und die Ergebnisse dann entsprechend in die alltäglichen Prozesse einfließen zu lassen.
Aber nach dem ersten Besuch und der ersten Analyse werden die meisten KMUs feststellen, dass beim doch weitestgehend geringen Datenbestand eine solche Vollzeitstelle oder gar ein zweiter Besuch eines externen Fachmannes nicht lohnt.
Gruß
Doc Storage