In einem kürzlich von IDC veröffentlichten Bericht mit dem Titel “DevOps and the Cost of Downtime: Fortune 1000 Best Practice Metrics Quantified” wurden die Kosten von Ausfallzeiten in Fortune 1000-Organisationen untersucht. Die Zahlen, die sie erreicht haben, können Sie überraschen. Die durchschnittlichen Kosten für Anwendungsausfallzeiten unter Vermögen 1000 Unternehmen wurde auf irgendwo zwischen 500.000 und 1 Million Dollar pro Stunde geschätzt! Die Gesamtkosten der Ausfallzeiten pro Jahr wurden auf 1,25 bis 2,5 Milliarden Dollar pro Jahr geschätzt.
Direktvertrieb, Verbrauchervertrauen, Markenmanagement und Produktivitätsverlust
Während diese Schätzungen wahrscheinlich auf dem hohen Ende liegen, wenn es um kleine und mittlere Unternehmen geht, weisen sie immer noch darauf hin, dass Ausfallzeiten reale Kosten für das Unternehmen haben – sei es der Verlust von Direktverkäufen, der Verlust des Verbrauchervertrauens aufgrund schlechter Benutzererfahrung, negatives Markenengagement oder Produktivitätsverlust – Ausfallzeiten führen zu Verlusten. Das Problem, das die meisten Unternehmen mit Ausfallzeiten haben, ist die Quantifizierung dessen, was bei einem unbekannten zukünftigen Vorfall verloren gehen wird. Leider legen die meisten Organisationen keinen Schwerpunkt darauf, Ausfallzeiten zu minimieren, bis sie durch einen Ausfall verletzt wurden, und selbst dann, da der Vorfall mit der Zeit immer weiter entfernt wird, neigt das Gefühl des realen Verlustes dazu, nachzulassen, und die Kosten für die Milderung zukünftiger Vorfälle erscheinen tendenziell unnötig. Was sind also die Kosten für Ausfallzeiten, und wie quantifizieren wir sie?
Die wahren Kosten von Ausfallzeiten
Ausfallzeiten wirken sich nicht nur auf den Direktvertrieb im Falle eines Verbrauchers aus, der mit einem Einkaufswagen konfrontiert ist, sondern kann auch psychologische Auswirkungen auf externe Benutzer wie einen Kunden oder einen neuen Interessenten und interne Nutzer, einschließlich Mitarbeiter und Aktionäre, haben. Es macht Sinn, dass ein Online-Warenkorb, der durchschnittlich 10.000 US-Dollar Umsatz pro Stunde hat, dazu neigt, 10.000 US-Dollar für jede Stunde zu verlieren, die die Website ausfällt, aber wie berechnen Sie die Anzahl der wiederholten Kunden, die während des Ausfalls die Website besucht haben, und feststellen, dass dieser bestimmte Anbieter nicht mehr vertrauenswürdig ist und daher nie für zukünftige Käufe zurückkehrt?
Was passiert, wenn eine große Wertpapierfirma Ausfälle als Zeichen von Instabilität und Veräußerungen der Aktien der Unternehmen sieht?
Was ist mit den Mitarbeitern, die eine interne Anwendung oder eine SaaS-App verwenden, die häufig abstürzt oder Ausfälle erleidet?
Die schnelle und schmutzige Antwort auf all diese Fragen ist, dass es keine Möglichkeit gibt, den genauen Wert dieser verlorenen Chancen oder die negativen Markenwahrnehmungen zu kennen, die während solcher Ausfälle aufgebaut wurden. Untersuchung der großen Akteure, die ähnliche negative Werbeveranstaltungen wie die 2013 Target Kreditkartenverletzung, auf die Target mit Rabatten in den Filialen sowie einem Jahr kostenloser Kreditauskünfte für seine Kunden reagierte, sagt uns, dass es aufgrund des Ausmaßes der Schadensbegrenzung, die solche Einzelhändler zu übernehmen bereit sind, eine ganze Reihe von zu erwartenden Schäden geben muss. Ein Blogbeitrag bei Mailchimp zum Umgang mit Website-Ausfällen identifiziert mehrere aktuelle Ausfälle großer Websites und spricht über die Bedeutung einer ordnungsgemäßen Kommunikation der Maßnahmen, die ergriffen wurden, um den Ausfall und zukünftige Maßnahmen zu mildern, die ergriffen werden, um sicherzustellen, dass es nicht wieder passiert. Wie Joel Spolsky es in einem seiner Blog-Einträge ausdrückte: “Essind die unerwarteten Unerwarteten, nicht die erwarteten Unerwarteten, die dich töten.” Die nächste Frage lautet also: Wie gehen wir mit Ausfallzeiten um?
Bekämpfung von Optimismus Voreingenommenheit
Es ist wichtig zu erkennen, dass unsere grundlegende Sicht auf unseren Platz in der Welt tendenziell voreingenommen ist. Es ist ein Teil der menschlichen Natur, eine selbstzentrierte Sicht der Ereignisse zu halten, wo wir dazu neigen zu glauben, dass wir immer das überdurchschnittliche Wesen sind, und dass im Allgemeinen schlechte Ereignisse jemand anderem passieren und uns nie passieren werden. Diese Optimismus-Voreingenommenheit führt dazu, dass wir glauben, dass wir uns keine Sorgen machen oder für die Schlimmsten-Fall-Szenarien oder sogar kleine Unannehmlichkeiten wie einen Anwendungs- oder Website-Ausfall planen müssen. Darüber hinaus bauen wir, je mehr Zeit zwischen solchen Ereignissen vergeht, eine Illusion der Kontrolle auf, bei der wir glauben, dass unsere positive Kontrolle über die Situation die Ergebnisse der Situation verbessert. Diese Illusion der positiven Kontrolle macht uns noch weniger wahrscheinlich, Minderungsstrategien in die Umlage zu setzen, um solche Ereignisse zu bekämpfen, wenn sie auftreten.
Die Kosten von Murphys Gesetz
Erfahrene Veteranen, die schon eine Weile in den IT-Gräben sind, sind unweigerlich in Murphys Gesetz gelaufen. Alles, was irgendwann schief gehen kann, wird schief gehen. Die Weisen unter uns haben Schritte in die richtige Richtung unternommen, um wachsam auf der Suche nach Ausfällen zu sein, und haben Pläne, um zukünftige Ereignisse zu beheben, zu beseitigen und proaktiv zu planen. Eine Schwierigkeit, die solche Branchenveteranen erleben können, ist das Buy-In von Management und anderen Abteilungen, wenn sie die Kosten sehen, die mit der Aufrechterhaltung eines aktiven Satzes von Disaster Recovery-Lösungen verbunden sind. Hier kommen Artikel wie die IDC-Umfrage über fortune 1000-Organisationen ins Spiel, um den Entscheidungsträgern zu helfen, den Wert von Diensten wie den Tools für die Website, die Anwendungs- und Serverleistungsüberwachung von Dotcom-Monitor zu verstehen.
Die Vorteile der Proaktivkeit
Die meisten Menschen verstehen intuitiv auf einer gewissen Ebene, dass es besser ist, proaktiv zu sein, als zu warten, bis die Katastrophe eintritt, um Maßnahmen zu ergreifen, aber lassen Sie uns sich ihr stellen – nur wenige Menschen waren jemals proaktiv aus dem Tor heraus, es sei denn, sie wurden bereits verbrannt – vielleicht nicht bei diesem Projekt, vielleicht nicht während dieses Jobs, aber jeder hat seine Prüfung durch Feuer gehabt, was sie dazu bringt, “proaktiv” auf ihre nachfolgenden Aufgaben zu reagieren. Aufgrund dieser Realität ist es wichtig, dass die IT-Fachleute, die verbrannt wurden und nun proaktiv sein wollen, konkrete Beispiele haben, die sie mit Denkern teilen, die in der Illusion der Kontrolle leben.
Wenn Sie eine aktive Überwachung einrichten, haben Sie sich darüber im Fallenund gedankenwillig informiert, dass, solange Sie keine Benachrichtigungen erhalten, alles ordnungsgemäß funktioniert und Sie Benachrichtigungen erhalten, sie in Echtzeit erhalten, sobald das Problem erkannt wurde. Dieser proaktive Ansatz kann auch zu schnellen Lösungen führen, hoffentlich bevor irgendjemand anderes – insbesondere Ihre Kunden – überhaupt bemerkt hat, dass es ein Problem gab. Auch wenn Sie das Problem nicht sofort beheben, zeichnet die proaktive Überwachung einen Verlauf der Ereignisse auf, sodass Sie später zurückgehen und das Ereignis analysieren und Wege finden können, um sicherzustellen, dass diese Art von Problem nicht erneut auftritt.
Zusätzliche Vorteile der synthetischen Überwachung
Sobald Sie synthetische Überwachung Setup für Ihre Websites, Server, Web-Apps, etc… es gibt eine ganze Reihe von zusätzlichen Vorteilen, die über das einfache Erhalten von Warnungen hinausgehen, wenn etwas ausfällt. Sie können historische Trends aufzeichnen, um herauszufinden, wie sich ebbe und der Fluss des Datenverkehrs auf die Reaktionsfähigkeit Ihres Servers auswirkt. Wenn Ihre Website wächst oder sich Ihre App weiterentwickelt, können Sie sehen, wie sich die Reaktionszeit durch immer größere Datenmengen auswirkt. Sie können die Hardwareleistung unter realen Benutzerlasten mit den Seitenladegeschwindigkeiten Ihrer Website korrelieren und diese Informationen verwenden, um zukünftige Systemaktualisierungen im Voraus zu planen.
Mit anderen Worten, sichern Sie sich gegen die Kosten von Ausfallzeiten durch die Implementierung von Website-Monitoring, um proaktiv auf das Schlimmste vorzubereiten. Eine Website-Monitoring-Lösung hilft Ihnen, inkrementelle Verbesserungen an Ihren Angeboten vorzunehmen, was indirekt dazu beiträgt, die Kundenbindung zu verbessern, die Frustration der Kunden durch langsame Reaktionen lindert und dazu beitragen kann, Trendprobleme zu identifizieren, sodass Sie kritische Probleme lösen können, bevor sie überhaupt auftreten. Wenn Sie also derzeit keine Überwachungseinrichtung haben, melden Sie sich für eine kostenlose Testversion an, um zu sehen, wie es selbst funktioniert.