Anzeige

Crowdstrike-Black-out: Doch! Microsoft ist auch schuld

Crowdstrike-Black-out: Doch! Microsoft ist auch schuldDer Zwischenfall mit Crowdstrike wurde umfassend beschrieben und diskutiert. Unter anderem wird die These vertreten, dass Microsoft in dem Falle eigentlich nichts falsch gemacht hat, auch von unserem Kollegen Michael Baumann. Das mag Doc Storage so nicht stehen lassen. Seiner Ansicht nach war es nur eine Frage der Zeit, bis so etwas passiert. Man hätte längst Sicherheitsmaßnahmen einbauen müssen.

Kommentar Doc Storage:

  • Ja, man kann: muss sich aber nicht darüber aufregen (siehe Kommentar): Doch, aus fachlicher Sicht bleibt uns nur, uns darüber aufzuregen. Über Qualität, über Stabilität, und all die anderen Mängel, die diese »Plattform« in den letzten drei Jahrzehnten angehäuft hat. Das hat weder etwas mit Romantik oder Expertentum zu tun, sondern etwas mit ganz nüchterner Betrachtung der Fakten. Und vor allem – doch, Microsoft hat so einiges falsch gemacht. Auch wenn die Herrschaften aus Seattle dieses, dies eine Mal nicht für den Ausfall verantwortlich waren. Warum hat man es versäumt, in den letzten Jahrzehnten keinen vernünftigen Schutz gegen fehlerhafte Software (und ich meine schlicht fehlerhaft, und nicht bösartig oder kriminell) einzubauen, inklusive einer schnellen und sicheren Rückkehr zu vorherigen lauffähigen Installationen?
      Alle Versuche waren bisher so zickig oder lückenhaft, dass man immer noch mit demselben Dateisystem arbeitet – den Zeitraum will ich jetzt gar nicht mehr nennen. Bei allen anderen, hier spöttisch erwähnten Systemen sind dutzende Ansätze gekommen und gegangen, und inzwischen haben sich ein halbes Dutzend brauchbare Lösungen herausgemendelt, mit deren Ansatz man sich hätte auf der Fensterseite Milliarden von Verlusten hätte größtenteils ersparen können.
  • (…) da wurden beim Aufspielen eines Updates natürlich Fehler gemacht: Natürlich? Ist es also natürlich, offenbar ungeprüfte Software in ein weltweit genutztes produktives System hineinzuschießen? Ohne diese Software eine ausreichende Zeit vorher auf einem System der Produktionsvorbereitung getestet zu haben?
    Anzeige

     Natürlich? Gar nichts ist hier natürlich! Hier ist ein Fehler passiert, der niemals hätte, so passieren dürfen, wenn die Beteiligten vernünftige DV-Orga gelernt hätten. Und selbst wenn dieser Fehler passiert wäre – wo waren bitte die Repliken oder mindestens die Backups der letzten als funktionstüchtig bekannten Versionen, die man einigermaßen zeitnah hätte einspielen können? Gab es die überhaupt? Ich fürchte nein.
  • Das alles hat nichts mit autonomer Aufstellung zu tun. DV ist heute dermaßen komplex, dass man sich schlicht nichtmehr nur und ausschließlich auf eigene Systeme und Software stützen kann. Allerdings muss es möglich sein, dass die Zulieferer wenigstens die Grundregeln professioneller DV befolgen – was offensichtlich nicht passiert ist (siehe 2).
  • Und ja – die alten Lamento-Opas, wie wir hier wohlfeil genannt werden, haben jahrzehntelang »im Keller« gesessen, und ja, haben alles schon vorher gewusst. Nicht das wie, aber dass es irgendwann so kommen musste. Wir alle, mit X auf dem Hemd, oder dem Auge, der Biene und dem M, würden buchstäblich erschossen werden, wenn wir nicht mindestens einmal, wenn nicht mehrfach täglich Sicherungen durchführen würden. Wenn wir nicht regelmäßige K-Fall-Übungen durchführen würden. Wenn wir nicht mindestens einmal pro Woche sicherstellen würden, dass sowohl die Backups als auch, wenn wir sie denn haben, die Repliken brauchbar sind.
  • Wir machen den jungen Leuten gar keinen Vorwurf. Können wir ihnen gar nicht machen, weil die Ausbildung heutzutage so gehen muss wie alles andere, schnell, schnell. Da wird Python gelernt, oder irgendein HTML, und alles auf Windows-Plattformen, weil es für die Ausbilder am einfachsten ist. Und am schnellsten geht. Da erwartet man allen Ernstes, dass diese armen Kollegen nach zwei drei Jahren Ausbildung brauchbare EDV betreiben können. Und – wie wir jetzt gesehen haben – können sie nicht!
  • Die Feststellung am Schluss ist goldrichtig: man kann den Miesepeter weiterleiten. Und genau darum geht es in den meisten Organisationen heutzutage. Möglichst 40 oder weniger Stunden und nur an Wochentagen arbeiten, dabei möglichst nicht auffallen, und das höchste Ziel ist, keine Fehler zu machen, nicht bei solchen erwischt zu werden und falls solche auftreten, diese ganz schnell an andere weiterzuleiten. Auffällig am Freitag war, wie schnell vor allem MS aus der Hecke gesprungen ist mit der Feststellung, man sei nicht verantwortlich.
  • In meinem ersten Beitrag zum Thema hatte ich das schonmal gefragt: Wie sieht es mit einer »Entschuldigung« aus? Gut, mittlerweile hat sich von George Kurz zu Wort gemeldet: »(…) I am deeply sorry for the disruption this outage has caused and personally apologize to everyone impacted. (…)«. Hat aus meiner Sicht zu lange gedauert. Aber gut, ich muss mich sputen, ich muss wieder in den Keller und mein Hörgerät aufladen.

    Der Meckeropa aus der richtigen EDV. ;-)

    Gruß
    Doc Storage

Anzeige