Monitoreo de DNS con cafeína y la interrupción de DNS de AT&T

Un artículo de Dotcom-Monitor »Monitoreo de DNS con cafeína y la interrupción de DNS de AT&T” publicado en SpeedAwarenessMonth.com sobre la interrupción del servidor de nombres de dominio (DNS) de AT&T del 15 de agosto de 2012 demuestra por qué un método no almacenado en caché de monitoreo de DNS da como resultado un tiempo de reparación (TTR) más rápido e incluso cero tiempo de inactividad debido al problema de DNS.

El artículo completo está disponible en SpeedAwarenessMonth.com sin embargo, los conceptos básicos incluyen:

Problema de interrupción de DNS de AT&TTo Cache or Not-to-Cache – esa es la pregunta de monitoreo de DNS

En primer lugar, generalmente no es bien conocido que el monitoreo de sitios web de tipo solicitud HTTP basado en externa, como el café en su articulación java local, viene en diferentes “grados”: basado en caché y no basado en caché. Dotcom-Monitor emplea monitoreo no caché, que se propaga a través del proceso completo de DNS con cada instancia de monitoreo. La supervisión basada en caché (utilizada por muchos servicios de supervisión básicos) no se propaga a través del proceso DNS y pasa por alto los problemas de DNS.

Cómo monitorear eficazmente la próxima situación de interrupción de DNS

En el caso del problema de interrupción de DNS de AT&T, hay varios factores clave que ayudan a acelerar el tiempo de reparación (TTR) o evitar el tiempo de inactividad:

  • Método de detección de errores: use una solución de supervisión que utilice un método que no sea de caché para propagar consultas DNS hasta los servidores de nombres raíz con cada instancia de supervisión. Un servicio de método de caché almacena en caché DNS y, por lo tanto, no detectará un problema de DNS secundario en absoluto, o puede tardar días o incluso semanas en detectar el problema.
  • Frecuencia de supervisión: utilice una frecuencia más rápida de supervisión sin caché, como cada 1 minuto en lugar de una vez por hora. Cuanto más rápido detecte y alerte la solución de supervisión sin caché a un administrador afectado de un sitio web que utiliza un servicio DNS defectuoso, más rápido se podrá realizar un cambio a un proveedor de conmutación por error de DNS.
  • Valor de la configuración de tiempo de vida (TTL): cuanto menor sea el valor de la configuración TTL utilizada por el administrador de DNS para conservar el almacenamiento en caché de IP del dominio de un dominio desde el servidor de nombres autoritativo principal, más rápido se podrá implementar la conmutación por error a otro proveedor de DNS. Normalmente establecido en 86.400 segundos (1 día) o más, en la planificación de recuperación ante desastres, el TTL se puede establecer tan bajo como una vez cada 300 segundos, sin embargo, cuanto menor sea la configuración, mayor será la carga en el servidor de nombres de dominio autoritativo.
  • Los diagnósticos, como una ruta de seguimiento automática en el momento del problema de DNS detectado, son proporcionados por la solución de monitoreo (tenga en cuenta que muchos servicios básicos de monitoreo no proporcionan ninguna información de diagnóstico).
  • Reparar: continúe supervisando durante la condición de error para identificar aún más el problema. Envíe los resultados supervisados a su proveedor de DNS. También puede ejecutar rutas de seguimiento de DNS manuales gratuitas en www.dotcom-monitor.com/WebTools/trace.asp (seleccione Estilo de seguimiento “DNS”) para verificar el problema según sea necesario.
  • Prevenir: Vigile los problemas de DNS de “error suave”, como las ralentizaciones de DNS y las interrupciones intermitentes de DNS, para que pueda tomar medidas antes de que el “error suave” se convierta en un “error grave”, como un cliente que enfrenta un tiempo de inactividad.

Gracias, tomaré la carga de doble profundidad con cafeína, sin caché

Está claro entonces que una combinación de factores que no son de caché y otros limitan la exposición al tiempo de inactividad debido a problemas como la interrupción de DNS de AT&T del 15 de agosto de 2012. Además, un método no almacenado en caché de monitoreo de DNS es un factor crítico para un TTR más rápido e incluso un tiempo de inactividad cero.

Finalmente, es importante recordar que TTR determina la pérdida debido al tiempo de inactividad. En otras palabras, cuanto más tiempo total se tarde en detectar, diagnosticar y reparar un problema de DNS, peor será el impacto del problema de DNS. Por el contrario, cuanto más rápido una solución de monitoreo acelera el TTR, más se reduce la pérdida o se evita por completo.

Similar a una buena taza fuerte de café con cafeína, un método sin caché puede marcar la diferencia entre un día de inactividad y un día productivo rápido.

Para obtener más información sobre la interrupción de DNS de AT&T, consulte nuestro artículo, Doing DNS Monitoring Right: The AT&T DNS Outage.

Latest Web Performance Articles​

Top 10 Synthetic Monitoring Tools for 2024

When it comes to ensuring your website’s performance and uptime, synthetic monitoring tools have become indispensable. These tools help businesses proactively detect and resolve issues

Start Dotcom-Monitor for free today​

No Credit Card Required