مقال بقلم دوت كوم مونيتور “يوضح Caffeed DNS Monitoring and the AT&T DNS OUTAGE” المنشور على SpeedAwarenessMonth.com فيما يتعلق بانقطاع خادم اسم نطاق AT&T (DNS) في 15 أغسطس 2012 لماذا تؤدي طريقة مراقبة DNS غير المخزنة مؤقتا إلى وقت أسرع للإصلاح (TTR) ، وحتى وقت توقف صفري بسبب مشكلة DNS.
المقالة الكاملة متاحة على SpeedAwarenessMonth.com ولكن الأساسيات تشمل:
إلى ذاكرة التخزين المؤقت أو عدم التخزين المؤقت – هذا هو سؤال مراقبة DNS
أولا ، ليس من المعروف عموما أن مراقبة موقع الويب من نوع طلب HTTP المستند إلى الخارج ، مثل القهوة في مفصل java المحلي ، تأتي في “درجات” مختلفة – تستند إلى ذاكرة التخزين المؤقت وغير المستندة إلى ذاكرة التخزين المؤقت. يستخدم Dotcom-Monitor المراقبة غير المخزنة مؤقتا ، والتي تنتشر من خلال عملية DNS الكاملة مع كل مثيل مراقبة. لا تنتشر المراقبة المستندة إلى ذاكرة التخزين المؤقت (المستخدمة من قبل العديد من خدمات المراقبة الأساسية) من خلال عملية DNS وتفوت مشكلات DNS.
كيفية المراقبة الفعالة لحالة انقطاع DNS التالية
في حالة مشكلة انقطاع AT&T DNS ، هناك العديد من العوامل الرئيسية التي تساعد على تسريع وقت الإصلاح (TTR) ، أو تجنب وقت التوقف:
- طريقة اكتشاف الأخطاء: استخدم حل مراقبة يستخدم طريقة غير ذاكرة التخزين المؤقت لنشر استعلامات DNS على طول الطريق إلى خوادم أسماء الجذر مع كل مثيل مراقبة. تقوم خدمة طريقة ذاكرة التخزين المؤقت بتخزين DNS مؤقتا وبالتالي لن تكتشف مشكلة DNS ثانوية على الإطلاق ، أو قد يستغرق الأمر أياما أو حتى أسابيع للكشف عن المشكلة.
- تكرار المراقبة: استخدم ترددا أسرع للمراقبة غير ذاكرة التخزين المؤقت ، مثل كل 1 دقيقة مقابل مرة واحدة في الساعة. كلما كان حل المراقبة غير المؤقت أسرع في اكتشاف وتنبيه مسؤول متأثر بموقع ويب باستخدام خدمة DNS فاشلة ، كلما كان من الممكن إجراء تبديل أسرع إلى موفر تجاوز فشل DNS.
- إعداد قيمة وقت العمل (TTL): كلما كانت قيمة إعداد TTL المستخدمة من قبل مسؤول DNS لاستمرار التخزين المؤقت ل IP للمجال من خادم الاسم الموثوق الأساسي أصغر كلما تم تنفيذ تجاوز الفشل إلى موفر DNS آخر بشكل أسرع. عادة ما يتم ضبطه على 86,400 ثانية (1 يوم) أو أكثر ، في التخطيط للتعافي من الكوارث ، يمكن تعيين TTL إلى مستوى منخفض مرة واحدة كل 300 ثانية ، ولكن كلما انخفض الإعداد ، زاد الحمل على خادم اسم المجال الموثوق.
- يتم توفير التشخيص – مثل مسار التتبع التلقائي في وقت اكتشاف مشكلة DNS – بواسطة حل المراقبة (ضع في اعتبارك أن العديد من خدمات المراقبة الأساسية لا توفر أي معلومات تشخيصية).
- إصلاح: استمر في المراقبة أثناء حالة الخطأ لتحديد المشكلة بشكل أكبر. أرسل النتائج التي تمت مراقبتها إلى موفر DNS. يمكنك أيضا تشغيل مسارات تتبع DNS اليدوية المجانية في www.dotcom-monitor.com/WebTools/trace.asp (حدد نمط التتبع “DNS”) للتحقق من المشكلة حسب الحاجة.
- المنع: راقب مشكلات DNS “الخطأ الناعم” ، مثل تباطؤ DNS وانقطاع DNS المتقطع ، حتى تتمكن من اتخاذ إجراء قبل أن يصبح “الخطأ الناعم” “خطأ ثابتا” مثل العميل الذي يواجه وقت توقف.
شكرا ، سآخذ تهمة العمق المزدوج التي تحتوي على الكافيين ، غير المخزنة مؤقتا
من الواضح بعد ذلك أن مجموعة من العوامل غير المخزنة مؤقتا وغيرها من العوامل تحد من التعرض لوقت التوقف عن العمل بسبب مشكلات مثل انقطاع AT&T DNS في 15 أغسطس 2012. علاوة على ذلك ، تعد الطريقة غير المخزنة مؤقتا لمراقبة DNS عاملا حاسما في TTR أسرع ، وحتى وقت توقف صفري.
أخيرا ، من المهم أن تتذكر أن TTR يحدد الخسارة بسبب وقت التوقف. وبعبارة أخرى، كلما طالت المدة الإجمالية التي يستغرقها اكتشاف مشكلة DNS وتشخيصها وإصلاحها، زاد تأثير مشكلة DNS سوءا. على العكس من ذلك ، كلما كان حل المراقبة أسرع في تسريع TTR كلما تم تقليل الخسارة أو تجنبها تماما.
على غرار فنجان قوي جيد من القهوة التي تحتوي على الكافيين ، يمكن لطريقة غير ذاكرة التخزين المؤقت أن تحدث فرقا بين يوم التوقف عن العمل ويوم الإنتاج السريع.
لمزيد من المعلومات حول انقطاع AT&T DNS ، راجع مقالتنا ، القيام بمراقبة DNS بشكل صحيح: انقطاع AT&T DNS.