Dans un récent rapport d’IDC intitulé « DevOps and the Cost of Downtime: Fortune 1000 Best Practice Metrics Quantified », le coût des temps d’arrêt a été exploré dans les organisations fortune 1000. Les chiffres qu’ils sont arrivés peuvent vous surprendre. Le coût moyen des temps d’arrêt des demandes parmi les entreprises fortune 1000 a été estimé entre 500.000 et 1 million de dollars de l’heure! Le coût total des temps d’arrêt par an était estimé entre 1,25 et 2,5 milliards de dollars par an.
Ventes directes, confiance des consommateurs, gestion de la marque et perte de productivité
Bien que ces estimations soient probablement sur le haut de gamme lorsqu’on parle de petites et moyennes entreprises, elles indiquent tout de même que les temps d’arrêt ont un coût réel pour les entreprises – qu’il s’agisse de la perte de ventes directes, de la perte de confiance des consommateurs en raison d’une mauvaise expérience utilisateur, d’une exposition négative à la marque ou d’une perte de productivité – les temps d’arrêt entraînent des pertes. Le problème que la plupart des entreprises ont à faire face aux temps d’arrêt est de quantifier ce qui sera perdu dans un incident futur inconnu. Malheureusement, la plupart des organisations ne mettent pas l’accent sur la réduction des temps d’arrêt tant qu’elles n’ont pas été touchées par une panne, et même alors, à mesure que l’incident s’estompe au fil du temps, le sentiment de perte réelle tend à s’estomper, et le coût de l’atténuation des incidents futurs tend à sembler inutile. Alors, quel est le coût des temps d’arrêt, et comment pouvons-nous le quantifier?
Le coût réel des temps d’arrêt
Les temps d’arrêt affectent non seulement les ventes directes dans le cas d’un consommateur confronté à un panier d’achat, mais ils peuvent avoir un effet psychologique sous-jacent à la fois sur les utilisateurs externes tels qu’un client ou un nouveau prospect et sur les utilisateurs internes, y compris les employés et les actionnaires. Il est logique qu’un panier d’achat en ligne qui coûte en moyenne 10 000 $ en ventes par heure aurait tendance à perdre 10 000 $ pour chaque heure de baisse du site Web, mais comment calculez-vous le nombre de clients réguliers qui se sont produits pour visiter le site pendant la panne et déterminer que ce fournisseur particulier n’est plus digne de confiance et, par conséquent, ils ne reviennent jamais pour les achats futurs?
Que se passe-t-il lorsqu’une grande société d’investissement voit les pannes comme un signe d’instabilité et de cession des actions des sociétés?
Qu’en est-il des employés utilisant une application interne ou une application SaaS qui se bloque fréquemment ou connaît des pannes ?
La réponse rapide et sale à toutes ces questions est qu’il n’y a aucun moyen de connaître la valeur exacte de ces opportunités perdues, ou les perceptions négatives de la marque construites lors de ces pannes. Étudier les grands acteurs qui ont vécu des événements de publicité négatifs similaires, tels que le 2013 La violation de la carte de crédit Target, à laquelle Target a répondu par des rabais à l’échelle du magasin ainsi qu’une année de rapports de crédit gratuits pour ses clients, nous indique qu’il doit y avoir pas mal de dommages prévus en raison de l’étendue du contrôle des dommages que ces détaillants sont prêts à entreprendre. Un billet de blog à Mailchimp concernant la gestion des pannes de site Web identifie plusieurs pannes récentes de grands sites Web et parle de l’importance d’une bonne communication des mesures prises pour atténuer la panne et les mesures futures qui seront prises pour s’assurer que cela ne se reproduise plus. Comme Joel Spolsky l’a dit dans l’une de ses entrées blog «Cesont les inattendus inattendus, pas les inattendus attendus, qui vous tuent.» La question suivante est donc la suivante : comment pouvons-nous faire face aux temps d’arrêt?
Lutter contre les préjugés d’optimisme
Il est important de se rendre compte que notre vision fondamentale de notre place dans le monde tend à être biaisée. C’est une partie de la nature humaine d’avoir une vision égocentrique des événements, où nous avons tendance à croire que nous sommes toujours l’être au-dessus de la moyenne, et que généralement, de mauvais événements arriveront à quelqu’un d’autre et ne nous arriveront jamais. Ce biais d’optimisme tend à nous amener à croire que nous n’avons pas besoin de nous inquiéter ou de planifier les pires scénarios, ni même de petits inconvénients tels qu’une application ou une panne de site Web. En outre, plus le temps qui passe entre de tels événements, nous construisons une illusion de contrôle où nous croyons que notre contrôle positif sur la situation améliore les résultats de la situation. Cette illusion de contrôle positif nous rend encore moins susceptibles de mettre en place des stratégies d’atténuation pour lutter contre de tels événements lorsqu’ils se produisent.
Le coût de la loi de Murphy
Les vétérans chevronnés qui ont été dans les tranchées de l’IT pendant un certain temps ont inévitablement couru dans la loi de Murphy. Tout ce qui peut mal tourner finira par mal tourner. Les sages d’entre nous ont pris des mesures dans la bonne direction pour être vigilants à l’affût des pannes, et ont des plans en place pour dépanner, éliminer et planifier de façon proactive les événements futurs. L’une des difficultés que ces anciens combattants de l’industrie peuvent éprouver est d’obtenir l’aide de la direction et d’autres ministères lorsqu’ils voient les coûts liés au maintien d’un ensemble actif de solutions de rétablissement après sinistre. C’est là que des articles tels que l’enquête d’IDC auprès d’organisations fortune 1000 viennent aider les décideurs à comprendre la valeur des services comme le site Web de Dotcom-Monitor, les outils de surveillance des performances des applications et des serveurs.
Les avantages d’être proactif
La plupart des gens comprennent intuitivement à un certain niveau qu’il est préférable d’être proactif que d’attendre jusqu’à ce que les grèves en cas de catastrophe pour prendre des mesures, mais permet d’y faire face – peu de gens ont jamais été proactifs à l’extérieur de la porte à moins qu’ils aient déjà été brûlés – peut-être pas sur ce projet, peut-être pas pendant ce travail, mais tout le monde a eu leur procès par le feu qui les amène à être «proactif» sur leur ensemble ultérieur de tâches. En raison de cette réalité, il est important pour les professionnels de l’informatique qui ont été brûlés et qui souhaitent maintenant être proactifs d’avoir des exemples concrets à partager avec les parties prenantes vivant dans l’illusion du contrôle.
La mise en place d’une surveillance active vous donne l’esprit que tant que vous ne recevez pas d’alertes, tout fonctionne correctement, et lorsque vous recevez des alertes, vous les recevez en temps réel, comme le problème a été identifié. Cette approche proactive peut également conduire à des résolutions rapides, espérons-le avant que quelqu’un d’autre – en particulier vos clients – a même remarqué qu’il y avait un problème. Même si vous ne résolvez pas immédiatement le problème, une surveillance proactive enregistre un historique de ce qui s’est passé afin que vous puissiez plus tard revenir en arrière et analyser l’événement et trouver des moyens de s’assurer que ce type de problème ne se reproduise plus.
Avantages supplémentaires de la surveillance synthétique
Une fois que vous avez la configuration de surveillance synthétique pour vos sites Web, serveurs, applications Web, etc … il ya un bon nombre d’avantages supplémentaires au-delà de simplement obtenir des alertes quand quelque chose se passe. Vous pouvez enregistrer les tendances historiques pour savoir comment le flux et le reflux du trafic affectent la réactivité de votre serveur. Au fur et à mesure que votre site Web se développe ou que votre application évolue, vous pouvez voir comment le temps de réponse est affecté par des quantités de données de plus en plus importantes. Vous pouvez corréler les performances matérielles sous les charges réelles des utilisateurs aux vitesses de chargement de page de votre site, et utiliser ces informations pour planifier à l’avance les futures mises à niveau du système.
En d’autres termes, se protéger contre le coût des temps d’arrêt en mettant en œuvre la surveillance du site Web pour se préparer de manière proactive au pire. Une solution de surveillance de site Web vous aidera à apporter des améliorations progressives à vos offres qui aident indirectement à améliorer la fidélité de la clientèle, soulagent la frustration des clients avec des réponses lentes et peuvent aider à identifier les problèmes de tendance afin que vous puissiez éliminer les problèmes critiques avant même qu’ils ne se produisent. Donc, si vous n’avez pas actuellement de configuration de surveillance, inscrivez-vous à un essai gratuit pour voir comment cela fonctionne pour vous-même.