Ведение DNS Мониторинг Право: AT и T DNS отключения
Сбой сервера доменных имен (DNS) 15 августа 2012 года иллюстрирует, почему «не кэш-основанный» метод мониторинга веб-сайтов важен для критически важных веб-сайтов. Во-первых, немного отзыв. Наиболее распространенная, основная форма мониторинга веб-сайта проводится с помощью синтетического браузера (а не фактического браузера), который подключается к целевому серверу через процесс запроса HTTP. Ряд процессов, ориентированных на сервер, таких как наличие целевого сервера, время, необходимое для загрузки HTML-файла для веб-сайта с сервера, и возможность обнаружения ключевых слов в файле HTML проверяются с помощью синтетического браузера с помощью процесса запроса HTTP.
Кэшировать или не кэшировать — вот в чем вопрос
Однако, что в целом не хорошо известно об основной синтетической методологии мониторинга HTTP является веб-сайт мониторинга компании имеют выбор – использовать “кэш” или “не кэш” методологии. Выбор методологии службой мониторинга непосредственно влияет на его способность обнаруживать проблемы на вторичных DNS-серверах, таких как сбой DNS AT и T, который произошел 15 августа 2012 года. С одной стороны, метод, основанный на кэше, гораздо проще для бизнеса мониторинга для реализации и стоит меньше для настройки и администрирования. В самом деле, большинство недорогих, “основных” служб мониторинга времени простоя использовать “метод кэша”.
Я возьму не кэш, спасибо
Тем не менее, грязный маленький секрет заключается в том, что метод мониторинга кэша не так точен (ни в долгосрочной перспективе, как экономически эффективный), как не кэш-решение. Почему? Простая причина в том, что методы, основанные на кэше, даже не обнаруживают вторичную проблему DNS.
Чуть более сложной причиной является больше, но на самом деле получает на мясо, что хороший мониторинг это все о – избегая простоев.
В частности, причина, не связанная с кэшем, является более рентабельной, заключается в том, что, когда такие проблемы, как отключение DNS AT и T, постоянно возникают , как и при любом состоянии ошибки веб-сайта , это общее время ремонта (TTR), который определяет потери из-за простоя. Другими словами, общее время (1) требуется для обнаружения, диагностики и ремонта ошибки, тем хуже влияние ошибки. И наоборот, чем быстрее решение мониторинга ускоряет TTR, тем больше уменьшается потеря (или полностью избегается).
Как эффективно контролировать следующую ситуацию с отключением DNS AT и T
В случае проблемы отключения DNS AT и T существует несколько ключевых факторов, определяющих время ремонта:
– Метод обнаружения ошибок: Используйте решение для мониторинга, которое использует метод, не являемый кэшем, для распространения DNS-запросов на протяжении всего процесса корневых серверов имен с каждым экземпляром мониторинга. Служба кэш-метода кэшируют DNS и поэтому вообще не обнаруживает вторичную проблему DNS, или для обнаружения проблемы могут потребоваться дни или недели.
-Частота мониторинга: Используйте более быструю частоту мониторинга не кэша, например, каждые 1 минуту по сравнению с раз в час. Чем быстрее решение для мониторинга не кэша обнаруживает и предупреждает повлияв на администратора веб-сайта с помощью неуспеваемой службы DNS, тем быстрее может быть сделан переход к поставщику отказов DNS.
– Частота настройки time-to-Live (TTL): Чем меньше значение параметра частот Time-to-live (TTL), используемого администраторами DNS для установки кэширования DNS на вторичном DNS-сервере доменного имени с основного авторитетного сервера имен. Обычно устанавливается до 86400 секунд (1-дневный) или более, в планировании аварийного восстановления TTL может быть установлен как только один раз в 300 секунд, однако чем ниже установка выше нагрузка на авторитетный сервер доменных имен.
-Диагностика – например, автоматическая трассировка во время обнаруженной проблемы DNS – обеспечивается решением мониторинга (большинство основных служб мониторинга не предоставляют никакой диагностической информации)
-Ремонт: Продолжить мониторинг решения во время состояния ошибки для дальнейшего выявления проблемы. Отправьте контролируемые результаты поставщику DNS. Вы также можете запустить бесплатные ручные трассировки DNS здесь (выберите Trace Style “DNS”), чтобы проверить проблему по мере необходимости.
-Предотвратить: Используйте решение для мониторинга, которое позволяет просматривать детали фактический мониторинг браузера) для того, чтобы увидеть “мягкие ошибки”, такие как замедление тенденции и периодические проблемы, так что вы можете принять меры, прежде чем “мягкая ошибка” становится “жесткой ошибкой”, таких как клиент сталкивается простоя.
(1) По данным организаций, участвовавших в исследовании TRAC, сентябрь 2011 года, организации определили количество времени, затученного на устранение проблем с производительностью, как свою основную проблему с “в среднем, в течение полной рабочей недели человеко-часов (46,2 часа), затраченных в ситуациях военной комнаты каждый месяц”.