بصفتك مطور ويب أو عضوا في فريق تكنولوجيا المعلومات ، لا يمكنك أبدا الحصول على الكثير من البيانات التي توضح بالتفصيل أداء موقع الويب الخاص بك وكيف يقارن بالآخرين في جميع أنحاء الصناعة. إحدى الطرق البسيطة لفهم كيفية مقارنة أداء موقع الويب الخاص بك بأخذ عينات متقاطعة من الإنترنت تستغرق ثلاث خطوات فقط:
- قم بتشغيل خط أساس لأداء الويب على موقعك باستخدام أداة مثل اختبار سرعة موقع الويب الخاص ب Dotcom-Monitor.
- قم بتشغيل استعلام على أفضل 100 موقع ويب أو أفضل 1000 موقع ويب باستخدام الأدوات الموجودة على HTTPArchive.
- httpsArchive.org
- قارن البيانات لمعرفة أين تقف ضد الصناعة.
يمنحك هذا نظرة ثاقبة رائعة على تحليلات ومتوسطات أداء الويب العامة ، ولكن لا يمكنك التعمق في التفاصيل. مجموعة البيانات التي تم التقاطها بواسطة أرشيف HTTP هائلة ، أكثر من 400 جيجابايت. ومع ذلك ، إذا كنت تزدهر على حلاقة ميلي ثانية من وقت تحميل الصفحة ، فأنت تريد الوصول إلى أكبر قدر ممكن من البيانات.
تحليلات أداء الويب في متناول يدك
الآن ، تتوفر الآن مجموعة بيانات HTTP Archive الكاملة على BigQuery ، وهي أداة Google تتيح للمطورين أو أي شخص آخر مهتم بالتحليلات المقارنة تحليل البيانات الضخمة في السحابة. يمكن للمستخدمين تشغيل استعلامات تشبه SQL مقابل مجموعات بيانات ضخمة والحصول على نتائج في ثوان. يمكنك الآن البحث في بيانات تحليلات أداء الويب التفصيلية واكتشاف الفروق الدقيقة الثاقبة في أداء موقع الويب بنفسك. إذا لم تكن قد جربت هذا بالفعل ، فأنت في عداد المفقودين. يمكنك تجميع أرقام أداء الويب إلى محتوى قلبك ، والحصول على تحليل متعمق للمكان الذي يتناسب فيه موقعك مع المزيج.
على سبيل المثال ، يمكنك تشغيل استعلامات أساسية حقا على مجموعات ضخمة من البيانات وتلقي النتائج على الفور. أجرينا استعلاما واحدا لتحديد أفضل 10 شبكات توزيع محتوى شائعة باستخدام الاستعلام التالي:
[note note_color=”#e7e7e7″]حدد cdn ، العد (cdn) كعدد من [httpsarchive:runs .2014_09_01_pages] حيث cdn <> “” المجموعة بواسطة CDN ترتيب حسب العد ديسك ؛[/note]التي أرجعت النتائج التالية:
عند التفكير في شبكات CDN الأكثر مرجعية ، تساءلنا أيضا عن المواقع التي تستضيف بشكل عام المواد الأكثر مرجعية (مثل شفرة التتبع للتحليلات وما إلى ذلك …) لذلك قمنا بتشغيل الاستعلام التالي لاسترداد هذه المعلومات:
[note note_color=”#e7e7e7″]حدد النطاق (req.url) Most_Referenced ، إجمالي العدد (*)من [httpsarchive:runs .2014_09_01_requests] ك REQ الانضمام (
حدد النطاق (عنوان URL) الذاتي، معرف الصفحة
من [httpsarchive:runs .2014_09_01_pages] ) كصفحات على الصفحات.pageid = req.pageid
أين المجال (req.url) != pages.self
مجموعة حسب Most_Referenced
النظام حسب مجموع desc ؛[/note]
ليس من المستغرب أن نرى العديد من الرواد يظهرون في كلتا القائمتين مثل Google و Akamai و Amazon cloudfront تستخدم جميعها على نطاق واسع كمضيفين للمحتوى بالإضافة إلى عناصر مرجعية إضافية.
قد لا تكون هذه البيانات مفاجأة كبيرة لأي شخص ، لكن هذه الاستفسارات تمس حقا غيض من فيض. يمكنك كتابة استعلامات أكثر تعقيدا للتعمق حقا في بيانات تحليلات أداء الويب وتحديد المحتوى ذي الصلة بمقاييس الأداء التي تهمك أكثر.
والأفضل من ذلك هو القدرة على استخدام جدول بيانات كواجهة أمامية لقوة معالجة البيانات الضخمة هذه. يتفاعل BigQuery الآن مع محرر مستندات Google ، مما يسمح للمستخدمين برؤية النتائج ومشاركتها بسرعة وسهولة – مع المدير وزملاء العمل المهتمين والمزيد.
في ما يلي مقطع فيديو رائع من محامي مطوري Google Ilya Grigorik في Velocity العام الماضي يوضح بالتفصيل كيفية البدء في استخدام بيانات أرشيف HTTP على BigQuery. لا تنسى: الخطوة الأولى هي الحصول على اختبار أداء الويب الأساسي لموقع الويب الخاص بك بحيث يكون لديك معايير لمقارنة تحليلات أداء الويب الخاصة بك ببقية الإنترنت.