15. August 2012 – Der ATT-DNS-Ausfall zeigt, wie wichtig die Ursachendiagnose in Echtzeit bei der Überwachung von Internetdiensten ist. Intermittierende ATT-DNS-Fehler wurden erstmals um 5:23 Uhr PST von Dotcom-Monitor entdeckt, eine volle Stunde, bevor AT&T das Problem meldete. Der Dotcom-Monitor Minnesota-Knoten hat das Problem bemerkt und zum Zeitpunkt des Fehlers eine diagnostische DNS-Ablaufverfolgung erfasst. Nicht-Clients von Dotcom-Monitor können hier ein kostenloses DNS-Trace-Tool verwenden, um zu testen, ob ihre Domain betroffen ist, indem sie den Trace-Stil “DNS” auswählen.
Diese Information wurde sofort an Dotcom-Monitor-Clients gesendet, deren Dienste vom ATT-DNS-Ausfall betroffen waren. Diese Diagnose lieferte Dotcom-Monitor-Clients sofortige Informationen, die die Ursache des Problems lokalisierten, ohne dass eine zusätzliche Fehlerbehebung erforderlich war. Dotcom-Monitor-Kunden, die ATT DNS verwenden, trafen extrem schnelle, fundierte Entscheidungen, z. B. das Verschieben ihres DNS zu einem anderen Anbieter oder das Ergreifen alternativer Maßnahmen zur Umleitung des Datenverkehrs.
Die DNS-Ablaufverfolgung, die zum Zeitpunkt der PST um 5:23 Uhr aufgezeichnet wurde, zeigt deutlich, dass AT&T-Server bei DNS-Abfrageanforderungen eine Zeitüberschreitung aufweisen.
- [198 .41.0.4]A.ROOT-SERVERS.NET : Typ=NS [time 62 ms]
- [192 .41.162.30]L.GTLD-SERVERS.NET : Typ=NS [time 31 ms]
- [12 .127.16.69]cmtu.mt.ns.els-gms.att.net : Typ=NS-Fehler [time 17628 ms] Zeitüberschreitung beim Empfangen.
- [199 .191.128.105]cbru.br.ns.els-gms.att.net : Typ=NS-Fehler [time 17628 ms] Zeitüberschreitung beim Empfangen.
- [198 .41.0.4]A.ROOT-SERVERS.NET : Typ=NS [time 62 ms]
- [192 .12.94.30]E.GTLD-SERVERS.NET : Typ=NS [time 109 ms]
- [12 .127.16.69]cmtu.mt.ns.els-gms.att.net : Typ=NS-Fehler [time 17628 ms] Zeitüberschreitung beim Empfangen.
- [199 .191.128.105]cbru.br.ns.els-gms.att.net : Typ=NS-Fehler [time 17628 ms] Zeitüberschreitung beim Empfangen.
Ablaufverfolgung abgeschlossen.
Diese beiden fett gedruckten sekundären AT&T-DNS-Server zeigen das Timeout-Problem. ATT-DNS-Serverinformationen basierend auf: https://dpt.ip.att.net/dpt_helphome/dns_seczones.htm
Der ATT-DNS-Ausfall unterstreicht, wie wichtig es ist, DNS während der Überwachung nicht zwischenzuspeichern. Dotcom-Monitor verwendet ein Nicht-Cache-Modell für die Überwachung, was bedeutet, dass jede Instanz der Überwachung “frisch” ist und eine vollständige DNS-Propagierung abschließt. In vielen Fällen erkennen Überwachungsdienste, die DNS zwischenspeichern, keine DNS-Ausfälle, wie z. B. den ATT-DNS-Fehler. Darüber hinaus führt Dotcom-Monitor zum Zeitpunkt eines DNS-Fehlers auch automatische Traceroutes durch, um die Besonderheiten von DNS-Fehlern aufzudecken. Diese Art der automatischen DNS-Diagnose ist entscheidend, um den DNS-Ausfall zu lokalisieren und die Reparaturzeit zu verkürzen, wodurch die Kosten für Ausfallzeiten bei DNS-Ausfällen gesenkt werden.