GoDaddy DNS 中断和亲子鉴定:谁是您的 GoDaddy?
这是昨天在DNS中断电视上的另一集Maury Povich亲子鉴定。 刚刚写了一篇关于 8 月 15 日重大 AT&T DNS 中断的文章,在这里我们再次在 2012 年 9 月 10 日见证了 GoDaddy DNS 中断。 数以百万计的网站和电子邮件用户 DNS 查找过程就像莫里·波维奇(Maury Povich)的亲子鉴定电视剧集出错一样。 首次访问 GoDaddy 网站的访问者在浏览器中输入 GoDaddy URL,来自 DNS 的答案会返回“这是您的 GoDaddy”。 或类似的东西。
处理 DNS 中断拒绝
此外,上个月DNS中断发生在AT&T DNS上。 那么,现在另一个“大爸爸”DNS提供商(再次)被暴露为不完全可靠,网站所有者该怎么办? 一种选择是切换到另一个DNS提供商,并赌“这个”DNS提供商在某种程度上不受互联网变幻莫测的影响。 或者,另一种选择是停止自欺欺人,长大并针对DNS提供商(就像互联网上的其他一切一样)并不完美,也永远不会完美的现实做一些现实的事情。 女士们,先生们,我们完全不大胆的预测是 – 重大DNS中断将很快再次发生。
使用您的 DNS :不要使用受污染的 DNS 测试套件
我认为更好的选择是使用“非基于缓存”的监控方法来实施网站监控,该方法将检测 DNS 问题(您可以 在此处 使用非缓存 DNS 查找进行测试 – 使用跟踪样式“DNS”免费)。 注意:基于缓存的监视服务无法准确检测 DNS 问题 – 只有非基于缓存的方法才能检测到。 在每次亲子鉴定结束时,莫里·波维奇都会说“你是父亲”或“你不是父亲”。 基本上,如果您使用缓存方法来监视语句,则更像是“您可能是也可能不是父亲 – 我们无法分辨。 不是好的电视,也不是好的DNS监控。
验收 1:规划未来的 DNS 中断
正如我写的“正确执行DNS监控:AT&T DNS中断”,通常不为人所知的是,用于网站监控的基本合成HTTP监控方法有两种“风格” – 使用“缓存”或“非缓存”方法。 监控服务对方法的选择直接影响其检测辅助DNS服务器上问题的能力,例如GoDaddy DNS中断和AT&T DNS中断。 一方面,基于缓存的方法对于监控业务来说要简单得多,并且设置和管理成本更低。 事实上,大多数低成本的“基本”正常运行时间监控服务都使用“缓存方法”。
接受 2:不是 GoDaddy DNS,也不是没有人 DNS 是完美的
具体来说,非缓存更具成本效益的原因是,当像GoDaddy和AT&T DNS中断这样的问题总是发生时 – 就像发生任何网站错误情况时一样 – 它是总修复时间(TTR)决定由于网站停机造成的损失。 换句话说,检测、诊断和修复错误所需的总时间 (1) 越严重。 相反,监控解决方案加快TTR的速度越快,损失就越少(或完全避免)。
好的,我拥有我的 DNS – 现在怎么办?
采取措施解决 DNS 中断问题 在 DNS 中断再次发生之前修复时间:
看,我们都会犯错。 生命和DNS传播只是发生了。 让我们做一些小的改变并掌握这一点,所以下次它发生时,它不会是一个大的Twitter提要道歉盛宴,对你的网站用户来说吓坏了,好吗?
– 错误检测方法:测试非缓存网站和 DNS 监控解决方案,该 解决方案使用非缓存 方法将 DNS 查询一直传播到每个监控实例的根名称服务器。 缓存方法服务缓存 DNS,因此根本不会检测到辅助 DNS 问题,或者可能需要几天或几周才能检测到问题。
-监视频率:使用更快的非缓存监视频率,例如每 1 分钟一次,而不是每小时一次。 非缓存监视解决方案检测受影响的管理员的速度越快,并使用失败的 DNS 服务向受影响的管理员发出警报,切换到 DNS 故障转移提供商的速度就越快。
– 生存时间 (TTL) 设置的频率:DNS 管理员用于将 DNS 缓存设置为主权威名称服务器中域名的辅助 DNS 服务器的生存时间 (TTL) 频率设置的值越小。 通常设置为 86,400 秒(1 天)或更长时间,在灾难恢复计划中,TTL 可以设置为每 300 秒一次,但设置越低,权威域名服务器上的负载就越高。
-诊断 – 确保您的网站监控服务在发生错误时提供诊断,例如在检测到DNS问题时自动跟踪路由。 如果没有诊断,您如何知道问题出在哪里? 注意:许多基本监视服务不提供任何诊断信息。
-修复:在错误情况下继续监控解决方案,以进一步查明问题。 将受监视的结果发送给您的 DNS 提供商。 您还可以 在此处 运行免费的手动非缓存 DNS 跟踪路由(选择跟踪样式“DNS”),以根据需要验证问题。
-预防:使用允许您查看 DNS 查找详细信息(例如实际浏览器监控)的监控解决方案,以便查看“软错误”(例如速度减慢趋势和间歇性问题),以便您可以在“软错误”变成“硬错误”(例如客户面临停机)之前采取措施。
下一步:“几个月后,我们将跟进,看看情况如何”
此处免费即时非缓存 DNS 测试此处免费 30 天试用非缓存 DNS 监控 此处完整 DNS 监控帐户设置
(1) 根据参与 2011 年 9 月核心预算资源委员会研究的组织,这些组织将解决性能问题所花费的时间确定为他们面临的最大挑战,“平均而言,每个月在作战室环境中花费的工时(46.2 小时)超过一整周。