15 août 2012 -La panne d’ATT DNS démontre l’importance du diagnostic des causes profondes en temps réel lors de la surveillance des services Internet. Des erreurs intermittentes d’ATT DNS ont été détectées pour la première fois à 5 h 23 H PST par Dotcom-Monitor une heure complète avant qu’AT&T ne rapporte le problème. Le nœud Dotcom-Monitor minnesota a noté le problème et capturé une trace diagnostique DNS au moment de l’erreur. Les non-clients de Dotcom-Monitor peuvent utiliser un outil de traçabilité DNS gratuit ici pour tester si leur domaine est affecté par la sélection de Trace Style «DNS».
Cette information a été envoyée immédiatement aux clients de Dotcom-Monitor dont les services ont été affectés par la panne d’ATT DNS. Ce diagnostic a donné aux clients dotcom-monitor des informations immédiates qui ont identifié la cause profonde du problème sans avoir besoin de dépannage supplémentaire. Les clients dotcom-monitor utilisant ATT DNS ont pris des décisions extrêmement rapides et éclairées, telles que le déplacement de leur DNS vers un autre fournisseur, ou la prise de mesures alternatives pour réafrouer le trafic.
La trace DNS prise au moment de la PST de 5h23 montre clairement le timing des serveurs ATT aux requêtes DNS.
- A.ROOT-SERVERS.NET [198 .41.0.4] : Type=NS [time 62 ms]
- L.GTLD-SERVERS.NET [192 .41.162.30] : Type=NS [time 31 ms]
- cmtu.mt.ns.els-gms.att.net [12 .127.16.69] : Erreur Type=NS Recevoir le délai [time 17628 ms] d’attente.
- cbru.br.ns.els-gms.att.net [199 .191.128.105] : Erreur Type=NS Recevoir le délai [time 17628 ms] d’attente.
- A.ROOT-SERVERS.NET [198 .41.0.4] : Type=NS [time 62 ms]
- E.GTLD-SERVERS.NET [192 .12.94.30] : Type=NS [time 109 ms]
- cmtu.mt.ns.els-gms.att.net [12 .127.16.69] : Erreur Type=NS Recevoir le délai [time 17628 ms] d’attente.
- cbru.br.ns.els-gms.att.net [199 .191.128.105] : Erreur Type=NS Recevoir le délai [time 17628 ms] d’attente.
Trace complète.
Ces deux serveurs DNS secondaires ATT en gras affichent le problème de temps d’out. Informations sur le serveur ATT DNS basées sur: https://dpt.ip.att.net/dpt_helphome/dns_seczones.htm
La panne ATT DNS souligne l’importance de ne pas mis en cache DNS lors de la surveillance. Dotcom-Monitor utilise un modèle non cache pour la surveillance, ce qui signifie que chaque instance de surveillance est «fraîche» et complète une propagation DNS complète. Dans de nombreux cas, les services de surveillance qui cachent DNS ne détecteront pas les pannes DNS, comme l’erreur ATT DNS. En outre, Dotcom-Monitor effectue également des traceurs automatiques au moment d’une erreur DNS afin de découvrir les détails des erreurs DNS. Ce type de diagnostic automatique DNS est essentiel pour identifier la panne DNS et accélérer le temps de réparation, ce qui réduit le coût des temps d’arrêt de panne DNS.