Monitoramento de DNS com cafeína e a paralisação do DNS AT&T

Um artigo do Dotcom-Monitor “O Monitoramento de DNS com cafeína e a paralisação do DNS AT&T” publicados em SpeedAwarenessMonth.com sobre a paralisação do servidor de nome de domínio AT&T (DNS) de 15 de agosto de 2012 demonstra por que um método não armazenado de monitoramento de DNS resulta em um tempo de reparo mais rápido (TTR) e até mesmo zero tempo de inatividade devido ao problema de DNS.

O artigo completo está disponível em SpeedAwarenessMonth.com no entanto, os fundamentos incluem:

Problema de paralisação do DNS AT&TPara cache ou não-para-cache – essa é a questão de monitoramento do DNS

Em primeiro lugar, não é geralmente bem conhecido que o monitoramento do site http baseado no exterior, como o café em sua junta java local, vem em diferentes “graus” – baseado em cache e não-cache baseado. O Dotcom-Monitor emprega monitoramento não armazenado em cache, que se propaga através do processo de DNS completo a cada instância de monitoramento. O monitoramento baseado em cache (usado por muitos serviços básicos de monitoramento) não se propaga através do processo DNS e perde problemas de DNS.

Como monitorar efetivamente a próxima situação de paralisação do DNS

No caso do problema de paralisação do DNS AT&T, existem vários fatores-chave que ajudam a acelerar o TTR (Time-to-Repair) ou evitar o tempo de inatividade:

  • Método de detecção de erros: Use uma solução de monitoramento que usa um método não-cache para propagar consultas DNS até servidores de nome raiz a cada instância de monitoramento. Um serviço de método de cache armazena DNS e, portanto, não detectará um problema secundário de DNS, ou pode levar dias ou até semanas para detectar o problema.
  • Frequência de monitoramento: Use uma frequência mais rápida de monitoramento não-cache, como a cada 1 minuto versus uma vez por hora. Quanto mais rápido a solução de monitoramento não-cache detectar e alertar um administrador impactado de um site usando um serviço DNS falhando, mais rápido um switch pode ser feito para um provedor de fail-over DNS.
  • Valor da configuração TTL (Time-to-Live): Quanto menor o valor da configuração TTL usada pelo administrador DNS para persistir o cache IP do domínio de um servidor de nome autoral primário, mais rápido o fail-over para outro provedor de DNS pode ser implementado. Normalmente definido para 86.400 segundos (1 dia) ou mais, no planejamento de recuperação de desastres o TTL pode ser definido tão baixo quanto uma vez a cada 300 segundos, no entanto, quanto menor a configuração, maior a carga no servidor de nome de domínio autoritário.
  • Os diagnósticos – como uma rota automática de rastreamento no momento do problema de DNS detectado – são fornecidos pela solução de monitoramento (tenha em mente que muitos serviços básicos de monitoramento não fornecem nenhuma informação de diagnóstico).
  • Reparo: Continue monitorando durante a condição de erro para identificar melhor o problema. Envie os resultados monitorados para o seu provedor de DNS. Você também pode executar rotas de rastreamento DNS manuais gratuitas em www.dotcom-monitor.com/WebTools/trace.asp (selecione “DNS” do Estilo de Rastreamento) para verificar o problema conforme necessário.
  • Prevenir: Fique de olho em problemas de DNS de “erro macio”, como lentidão do DNS e paralisações intermitentes de DNS, para que você possa agir antes que o “erro suave” se torne um “erro difícil”, como um cliente enfrentando tempo de inatividade.

Obrigado, eu vou tomar a carga de profundidade dupla cafeína, não-cached

É claro, então, que uma combinação de não-cache e outros fatores limitam a exposição ao tempo de inatividade devido a problemas como a paralisação do DNS AT&T de 15 de agosto de 2012. Além disso, um método não armazenado em cache de monitoramento de DNS é um fator crítico em um TTR mais rápido e até mesmo zero tempo de inatividade.

Por fim, é importante lembrar que o TTR determina a perda devido ao tempo de inatividade. Em outras palavras, quanto mais tempo total necessário para detectar, diagnosticar e reparar um problema de DNS, pior será o impacto do problema do DNS. Por outro lado, quanto mais rápido uma solução de monitoramento acelerar o TTR, mais a perda é reduzida ou completamente evitada.

Semelhante a uma boa xícara forte de café cafeína um método não-cache pode fazer a diferença entre um dia de inatividade e um dia produtivo rápido.

Para obter mais informações sobre a paralisação do DNS at&T, consulte nosso artigo, Fazendo o monitoramento do DNS Direito: A Paralisação do DNS AT&T.

Artigos mais recentes sobre desempenho na Web

Comece o Dotcom-Monitor gratuitamente hoje

Não é necessário cartão de crédito