Qu’est-ce que les temps d’arrêt et les temps d’arrêt?

En général, une valeur uptime reflète un pourcentage de temps, mesuré dans les limites d’une période déterminée, au cours de laquelle Dotcom-Monitor reçoit des réponses réussies de agents de surveillance situés dans le monde entier

. La valeur downtime reflète un pourcentage de temps, mesuré dans les limites d’une période spécifiée, au cours de laquelle Dotcom-Monitor a reçu des réponses négatives.

Vérifications manuelles des temps de disponibilité/temps d’arrêt du serveur

Il existe de nombreux outils commerciaux et open-source gratuits et la solutiondisponible que vous pouvez utiliser pour vérifier l’état et les performances de vos serveurs Web. Bien que ces outils soient excellents pour vérifier l’état,le temps de réponse et les performances à ce moment-là, having à exécuter manuellement des tests pour repérer la vérification pour les erreurs de serveur prend du temps et des ressources et ne vous donnera des résultats qu’à partir du moment du test. Découverte d’erreurs tout en exécutant des tests manuels peuvent avoir eu un impactsur vousr clients ability pour accéder à votre site Web et l’entreprise.

Automatiser la surveillance des temps de disponibilité et des temps d’arrêt

Les problèmes de serveur peuvent être difficiles à identifier et peuvent prendre beaucoup de temps à assainir, de sorte que le temps est de l’essence when erreurs se produisent. Jef vous n’avez pas mis en place de surveillance automatisée pour vos serveurs, et des erreurs se produisent et continuent un signifavant d’être découverts, les dommages ont peut-être déjà été causés. Automatisation du serveur moniteuring et mise en place de mesures proactives Uptime/contrôles des temps d’arrêt vous permet de ensemble monitoanneau cdiables und obtenir des alertes immédiates lorsque des temps d’arrêt se produisent, permettant à vos équipes de dépanner rapidement les erreurs et le keep vos clients from ayant un utilisateur négatif expérience ou le risque Fpertes inanciales à le iness bus.

Surveillance du respect des accords de niveau de service

De plus, le suivi des disponibilités peut aider à s’assurer que les fournisseurs de services adhèrent à leur ALS (Accord de niveau de service) Engagements. Pour en savoir plus sur le rapport de l’ALSdans la solution Dotcom-Monitor, veuillez lire notre article de base de connaissances sur la façon de créer des rapports SLA

. Le rapport de l’ALS est un groupe de rapport spécial qui vous fournit une vue unique des performances de l’ALS sur des intervalles de temps spécifiés.

Comment définissez-vous les temps d’arrêt pour les besoins de l’entreprise?

Avec eese facteurs à l’esprit, voici plusieurs exemples quand compte tenu de la façon dont vous définissez les temps d’arrêt.

  • Si vous avez régulièrement planifié la maintenance sur votre serveur web tous les dimanches soirs, votre site web est-il en panne ?
  • Vous avez un serveur Web basé à Chicago ne peut pas être atteint à partir d’Orlando, FL êtrecause de votre fournisseur de services a un problèmeà Orlando, mais il est disponible à partir du reste des États-Unis , est votre site webvers le bas?
  • Si un élément hébergé par untiers, comme un widget de chat par exemple,connaît une erreur de serveur, mais que le reste de votre site web est disponible, votre site Web est-il en panne ?
  • Si votre site web n’est pas disponible de n’importe où dans lemonde , en raison d’un hoquet serveur ou une autre erreur de serveur, et durents pendant plus de 5 secondes,est votre site web vers le bas?
  • Si vous exploitez un site web de vente au détail et le processus de panier fonctionne correctement,mais une page différente, comme votre page About Us par exemple, ne se charge pas, est votre site web versle bas?
  • Si l’un de vos serveurs DNSest en panne, mais que trois autres fonctionnent, ce qui équivautà 25 % des clients qui ne sont pas en mesure de accéder au site Web après l’expiration du délai de mise en cache (TTL), est-il considéré comme une condition descendante?
  • Si l’un des trois serveurs Web d’une ferme Web est en panneet que le temps de réponse à la page a augmenté de 10 %, 25 pour cent, ou même 50 pour cent plus lent charge de page time, whereconsidérez-vous lorsque les temps d’arrêt se produit?

Personne n’aime être appelé ou alerté au milieu de la nuit lorsque sérieux problèmes de temps d’arrêt se produisent. Si les réponses initiales pour Dpropre temps signifiait se réveiller à 2 a.M. pour résoudre le problème, serait l’une des réponses aux questions ci-dessus changer votre surveillance approche ou réponse en ce qui concerne Uptime et Dà temps propre?

Approche de calcul des temps d’arrêt et des temps d’arrêt

Le calcul des temps d’arrêt ou des temps d’arrêt permet de définir soigneusement comment la plate-forme Dotcom-Monitor interprète les réponses comme des réponses « up » ou « down ». Ceci est accompli en utilisant des filtres. Les filtres vous permettent de définir des conditions et des paramètresspécifiques pour la surveillancedes durée de surveillance,échecs de tâches, codes d’erreur, etc. , pour les agents de surveillance. Les filtres peuvent également être utilisés pour définir comment les alertes sont envoyées et reçues, limiter ou ignorer le nombre de fausses alertes, that pourraitinvolontairement être déclenchée, pour répondreaux besoins de votre entreprise et l’environnement de surveillance.

Incidemment, un filtre peut également être appliqué à un dispositif (coupe faux déclenchement) et à n’importe quel type de rapport.

Le filtrage définit les états haut/bas

en utilisant les critères réglables suivants :

  • L’e rror est signalé pendant un certain nombre de minutes.
  • L’e rror est confirmé par un nombre spécifié de messieurs A.
  • L’e rror est détecté dans un certain nombre de tâches.

Tous les filtres et leurs paramètres sont disponibles en accédant Configurer > les filtres. Une fois qu’un filtre est appliqué à un dispositif de surveillance, tous les notifications sont basées sur les critères du filtre.

Un default filter est affecté à tous les nouveaux appareils. Le filtre par défaut a une configuration équilibrée et convient à la plupart des dispositifs.

Calculs de disponibilité/temps d’arrêt

La formule

mathématique

pour le calcul des temps

d’arrêt

est indiquée

ci-dessous.

 

Durée des temps d’arrêt

Durée des temps d’arrêt Est liée directement aux configurations dans le filtre.

  • Le temps d’arrêt 

    commence lorsque les conditions d’un filtre sont remplies. Par exemple, lorsque le nombre de Lesmessieurs qui signalent une défaillance sont égaux au nombre de messieurs Aspécifiés dans le filtre, et comme indiqué également les conditions sontremplies pour le nombre de minutes et de tâches, puis une alerte de temps d’arrêt est envoyée.

  • La disponibilité 

    période commence lorsque les conditions du filtre ne sont plus remplies. spécifiquement La disponibilité 

    commence lorsque le nombre de messieurs A,minutes ou tâches qui ont signalé le succès «up» ne répondent plus aux conditions nécessaires pour les conditions «vers le bas» filtrées. Par exemple, un «up» état est indiqué lorsque le nombre d’erreurss,ou réponses «vers le bas»,reçues par le suivi Ungents devient inférieur au nombre d’erreurss,ou réponses « vers le bas», dont les messieurs ontbesoin, comme indiqué dans le filtre, afin d’indiquer une condition « vers le bas ».

Durée d’un État non défini

Un état non défini peut être défini lorsque le statut de chaque Agent impliqué dans la surveillance devient indéfini. Un statut d’agent est considéré comme non défini devient Non défini si le gent Ane fournit pasde réponse, ni une réponse d’erreur ou une réponse réussie, pour une durée déterminée.

Durée du temps d’attente de réponse = (nombre

 

de tous les agents

+1) ×

fréquence de surveillance

 

+ 15 min

utes

 

Par exemple, si

nous considérons une

situation

nous utilisons

trois

Un

messieurs et une fréquence de surveillance toutes

les

5 minutes,

 

e

ach

Un

gent attendra une réponse pendant

35

minutes.

Le

le calcul

de la durée du temps d’attente de réponse

est

comme suit:

Durée du temps d’attente de réponse = (3+1)

 

×5 +15 min

utes

= 35 min

utes

 

Une fois le délai expiré et qu’aucune réponse n’est

reçue,

le gent

A

signale

un état de


Non défini

.

Durée de l’état reporté

Report d’une surveillance l’appareil à tout moment arrêtera toute activité de surveillance jusqu’à ce qu’il soit ré-activé.

Durée exclue par l’annexe

Une autre entité qui peut affecter

considérablement les

calculs de disponibilité/temps

d’arrêt

sont

Horaires. Horaires en guise de une option pour gérer votre suivi agents pendant périodes de routine ou schémaDuled (uled) entretien. La surveillance peut être reportée pour des jours spécifiques de la semaine, ainsi que des heures et des minutes spécifiques pendant une journée. Pour établir un horaire, suivez les étapes de notre horaire, suivez les étapes Configuration d’un

 

article de la base de connaissances

de l’annexe.

 

 

Tout changement dans un monitoring appareilEst réglages, y compris redémarrage d’un monitoring appareil, au cours de la en bas l’état réinitialisera l’état de sorte qu’aucune alerte de disponibilité ne sera envoyée.

Exemple de disponibilité/temps d’arrêt du serveur

Par exemple, pour un exemple de la façon dont un agent de surveillance traiter et de répondre avec un temps de disponibilité ou d’arrêt, disons que nous avons un dispositif de surveillance qui est surveillé à partir de sept emplacements et il ya un ensemble de filtres que trois emplacements doivent signaler une erreur quand une condition de temps d’arrêt est remplie. Ce scénario est représenté dans le tableau ci-dessous.

example_regular

Comme vous c unvoir à partir du diagramme ci-dessus, un monitoring nœud (Ungent 1) détecte une erreur tandis que le reste des agents continuent de faire état de succèsréponses ful. prochain, un deuxième nœud de surveillance, agent 2, détecte une erreur, qui est suivie d’une réponse d’erreur d’un troisième et dernier nœud de surveillance, Agent 4. Cette dernière réponse aux erreurs, située au point T4 dans le diagramme, déclenche le filtre pour définir les temps d’arrêt à partir

de ce moment.

L’état Down

restera jusqu’à ce que vous définissiez unepériode postpone . Dans ce diagramme, nous avons fixé un report hypothétique, situé au point T5 en raison de la nombre d’erreurs de déclarationd’A gent a atteint le seuil prédéfini de trois dispositifs de surveillance pendant la durée de la session.

L’écart de temps entre les points T6 et T7 sur le graphique est une illustration du fait que la première réponse inclut un retard ( letemps de traitement des sessions de suivi comprend les retards de transfert de réseau et l’exécution elle-même), de sorte que le temps «reporté» est calculé comme ∆ (T7-T5) (Indiqué sur le graphique comme reporté 2nd).

Ici, ungain, nous tombons dans le temps d’arrêt

que sur la troisième erreur de l’agent 3 et reprendre un état de disponibilité

que sur le point réponse T9, lorsque le nombre d’agents défaillants devient inférieur à ajusté dans le filtre. Voici la formule finale de calcul du pourcentage de temps d’arrêt pour cet exemple.

Surveillance des temps d’disponibilité et des temps d’arrêt avec Dotcom-Monitor

Pour automatiser le processus de surveillance des temps de disponibilité et d’arrêt,vous devez utiliser une solution quioffre une visibilité complète de bout en bout dans l’infrastructure health et les performances,ainsi que de fournir des fonctionnalités, comme la possibilité de surveiller à partir de plusieurs emplacements mondiaux, configurer des calendriers spécifiques, filtres, alertes immédiates, rapports et les mesures, et bien plusencore. Toutes ces fonctionnalités donnent aux utilisateurs to correspondre aux exigences et aux besoins de leur entreprise. Tla plate-forme Dotcom-Monitor fournit toutes ces fonctionnalités de base, ainsi que des paramètres de configuration plus avancés et des intégrations tierce,le tout à partir d’un seul tableau de bord. En savoir plus about toutes les solutions de surveillance disponibles

auprès de Dotcom-Monitor pour assurer la disponibilité 24/7 de vos sites Web, API et applications Web.