什么是正常运行时间和 停机时间?
通常,u ptime 值反映在指定时间段内测量的时间百分比,在此期间,Dotcom-Monitor 收到来自 监控世界各地的代理。 d 自己的时间值反映在指定期间范围内测量的时间百分比,在此期间 Dotcom-Monitor 收到负响应。
手动服务器正常运行时间/停机时间检查
有许多免费的商业和开源工具 和解决方案可用,您可以使用它来检查 Web 服务器的状态和性能. 虽然这些工具非常适合检查 状态、响应时间和当时的性能,ha ving 手动运行测试以进行抽查 服务器错误 是耗时 和资源 消耗 并且只会在测试时给出结果。 发现任何错误 而运行手动测试可能影响你r 客户端的 ability 访问您的网站和 业务。
自动正常运行时间/停机时间监控
服务器问题可能难以精确定位,而且修复时间可能非常耗时,因此时间非常长。发生 en 错误。 Ⅰ如果您尚未为服务器设置自动监视,并且会发生错误并继续 一个标志在被发现之前, 可能已经做了大量的时间。 自动化服务器 监控ing 和 设置主动 美国ptime/停机时间检查允许您持续和自动 设置莫尼托环 c赫克斯一个d 在停机发生时立即收到警报,让您的团队快速排除错误和酮p 您的客户 from 有 负用户 经验 或风险 F商业损失到 the 巴士iness 。
监控服务级别协议的遵守情况
此外,监控正常运行时间有助于确保服务提供商遵守其 SLA( 服务级别协议) 承诺。 了解有关 SLA 报告有关问题在 Dotcom 监视器解决方案中,请阅读我们的知识库文章,了解如何 创建 SLA 报告。 SLA 报告是一个特殊的报告组,它为您提供在指定时间间隔内对 SLA 性能的单一视图。
如何为业务需求定义 停机时间?
与 these 因素 ,下面是几个例子 当 考虑 如何定义停机时间。
- 如果您每周 天晚上 定期对 Web 服务器进行维护,您的网站是否关闭?
- 你有一个总部设在芝加哥的网络服务器无法从奥兰多,佛罗里达州,因为你的服务提供商在奥兰多有问题,但它是从美国其他地区,您的网站关闭?
- 如果第三方托管元素(例如聊天小部件)遇到服务器错误,但网站的其余部分可用,您的网站是否关闭?
- 如果您的网站不能从世界上任何地方,由于服务器打盹或其他一些服务器错误,和最后s超过5秒,您的网站是否关闭?
- 如果你经营一个零售网站,购物车过程是正常工作,但不同的页面,例如,你的关于我们页面,是没有加载,您的网站是否关闭?
- 如果您的 DNS服务器 s已关闭,但其他三个服务器正在工作,这相当于25% 的客户端无法 在 缓存的实时时间 (TTL) 过期 后访问网站, 它被视为 向下状态 吗?
- 如果 Web 服务器场中的三个 Web 服务器之一关闭,并且页面响应时间增加了 10%,则 25%,甚至50%慢的页面加载时间,你考虑什么时候发生停机?
没有人喜欢在半夜被叫或报警时 严重 出现停机问题。 如果初始答案 D自己的时间意味着醒来在 2 a.m. 解决问题, 会 上述问题的任何答案都改变了您的监控 方法或响应 因为它涉及到 美国ptime 和 D自己的时间?
正常运行时间/停机时间计算方法
计算正常运行时间或停机时间提供了一种仔细定义 Dotcom-Monitor 平台如何将响应解释为”向上”或”向下”响应的方法。这是通过使用筛选器来完成的。筛选器允许您为监视设备设置特定的条件和参数,例如 监视持续时间、任务失败、错误代码等。,用于监视代理。还可以使用筛选器来定义如何发送和接收警报,以 限制或忽略虚假警报的数量,t可能会无意中被触发,以满足您的业务和监控环境的需求。
顺便说一句,筛选器也可以应用于设备(切割错误触发)和任何类型的报告。
- e rror 报告指定分钟数。
- error 由指定数量的A绅士确认。
- 在指定数量的任务中检测到 e rror。
所有筛选器及其设置都可通过访问 配置筛选器 >. 将筛选器应用于监控设备后,所有监控设备的 通知基于筛选器的条件。
A default filter 分配给所有新的监控 装置s. 默认筛选器具有平衡配置,适用于大多数监控 设备。
正常运行时间/停机时间计算
停机时间计算的数学公式如下所示。
停机时间
停机时间 持续时间直接与筛选器中的配置绑定。
- 停机时间 期间从满足筛选器条件时开始。 例如,当 报告故障的绅士等于筛选器中指定的 A根子数,并且也指定了满足分钟数和任务数的条件,然后发送停机时间警报。
- 正常运行时间 当不再满足筛选器的条件时,期间开始。 特别 当报告 “u p”成功的 A根人、分钟或任务 数 时,正常运行时间开始 不再满足过滤的”向下”条件所需的条件。 例如,””当错误数s或 “向下” 响应, 通过监控 接收 绅士变得小于错误数,或 “向下”响应,即绅士需要,如过滤器中设置的,以指示”向下”条件。
未定义状态的持续时间
当每个 A 的状态时,可以设置未定义状态参与监视的绅士变得未定义。 代理状态被视为未定义状态 如果 A gent在指定的时间长度内未提供任何响应(错误响应或成功响应),则未定义。
响应等待时间 = (所有代理数+1) ×频率 = 15 分钟utes
例如, 如果我们考虑使用 三 个监控 的情况 绅士和监控频率每5分钟, 一个 绅士会等待 35 分钟的答复 。 的 响应 等待时间的计算 为 如下:
响应等待时间 = (3+1) ×5 +15 分钟utes = 35 分钟utes
一旦时间过期,没有收到任何响应,Agent 将报告状态 未定义。
延迟状态的持续时间
推迟 监视 设备 将随时停止任何监视活动,直到重新启用。
计划排除的持续时间
另一个可显著影响正常运行时间/停机时间计算的实体是 Schedules. Schedules 作为 管理监视的选项 代理 在 期间 常规 或 scheD乌莱德 维护。 监控可以推迟到一周的特定日期, 以及一天中的具体小时和分钟数。 要设置计划,请按照我们计划中的步骤操作,按照我们计划中的步骤操作 配置计划知识库文章。
服务器正常运行时间/停机时间示例
例如,监视代理如何处理和响应正常运行时间或停机时间状态,假设我们有一个监视设备,该设备正在从七个位置进行监视,并且有一个筛选器集,其中三个位置必须在满足停机时间条件时报告错误。 此方案如下图所示。
从上图中看, a 监测 节点 (A绅士 1) 检测到错误, 而其余的 代理 仍在报告成功富的响应. 下一个,第二个监视节点,代理 2, 检测到错误, 后面是来自 第三和最后 监视节点, 代理 4. 此最终错误响应,位于 在图中的 T4 点,触发筛选器以从这一刻开始设置停机时间。
向下状态将一直保留, 直到您设置一个 postpone 周期. 在此图中,我们设置了一个假设的延迟,位于点 T5,因为 在监视期间,A gent的报告错误数已满足三个监控设备的预定义阈值 会话。
图上点 T6 和 T7之间的时间差距说明了第一个响应包括延迟的事实 (监控会话处理时间包括网络传输延迟和执行本身),因此”延迟”时间计算为 ∆ (T7+T5) (在图表上指示为“延迟2nd”)。
在这里,我们陷入停机时间, 只从代理3的第三个错误, 并恢复正常运行时间状态只 点 T9 响应,当故障代理数小于筛选器中调整时。 以下是此示例的最终停机时间百分比计算公式。
使用 Dotcom 监视器监控 正常运行时间和停机时间
自动化 监控正常运行时间和停机时间,您需要利用一个解决方案,提供对基础设施 Health 和性能的端到端全面可视性,并提供功能,例如从多个全局位置进行监视、配置特定计划、筛选器、即时警报、 报告和 指标,等等。 所有这些 功能都为用户提供了 符合业务的要求和需求. T他Dotcom-Monitor平台提供所有这些基本功能,以及更高级的配置设置和第三方集成,所有这些都来自一个仪表板。了解更多来自 Dotcom-Monitor 的所有监控解决方案,以确保网站、API 和 Web 应用程序的24/7 正常运行时间。