Creuser profondément sur l’analyse des performances Web avec HTTP Archive et BigQuery

En tant que développeur Web ou membre de l’équipe informatique, vous ne pouvez jamais avoir trop de données détaillant les performances de votre site Web et comment il se compare à d’autres à travers l’industrie. Une façon simple de comprendre comment les performances de votre site web se compare à un échantillonnage croisé de l’Internet ne prend que trois étapes:

  1. Exécutez une ligne de base de performance Web sur votre site à l’aide d’un outil tel que le test de vitesse du site Web deDotcom-Monitor.
  2. Exécutez une requête sur les 100 principaux sites Web ou top 1000 en utilisant les outils sur le HTTPArchive.
  3. httpsArchive.org
  4. Comparez les données pour voir où vous en êtes par rapport à l’industrie.

Cela vous donne un excellent aperçu de l’analyse générale des performances web et des moyennes, mais vous ne pouvez pas creuser dans les détails. L’ensemble de données capturé par HTTP Archive est énorme, bien plus de 400 Go. Toutefois, si vous vous épanouissez sur le rasage millisecondes à partir d’un temps de chargement de page, vous voulez accéder au plus de données possible.

L’analyse des performances Web à portée de main

Maintenant, l’ensemble complet de données HTTP Archive est maintenant disponible sur BigQuery, un outil Google qui permet aux développeurs ou à toute autre personne intéressée par l’analyse comparative d’analyser le Big Data dans le cloud. Les utilisateurs peuvent exécuter des requêtes sql-like contre d’énormes ensembles de données et obtenir des résultats en quelques secondes. Maintenant, vous pouvez creuser dans les données détaillées d’analyse des performances web et de découvrir des nuances perspicaces sur les performances du site web vous-même. Si vous n’avez pas déjà essayé cela, vous êtes absent; vous pouvez croquer les numéros de performances Web au contenu de votre cœur, et obtenir une analyse approfondie de l’endroit où votre site s’intègre dans le mélange.

Par exemple, vous pouvez exécuter des requêtes de base sur d’énormes ensembles de données et recevoir des résultats immédiatement. Nous avons lancé une requête pour déterminer les 10 réseaux de distribution de contenu les plus populaires avec la requête suivante :

[note note_color=”#e7e7e7″]SÉLECTIONNEZ cdn, Count(cdn) comme Count FROM Web Performance Analytics - Top 10 DCN [httpsarchive:runs .2014_09_01_pages] WHERE cdn < > «» GROUP BY cdn ORDER BY Count Desc;[/note]

qui a retourné les résultats suivants:

Lorsque nous pensons aux CDN les plus référencés, nous nous sommes également demandé quels sites hébergent en général le matériel le plus référencé (comme le code de suivi pour l’analyse, etc…), alors nous avons couru la requête suivante pour récupérer ces informations :

[note note_color=”#e7e7e7″]SÉLECTIONNEZ DOMAINE (req.url) Most_Referenced, COUNT(*) TotalLes plus référencés - HTTP Archive et BigQuery
DE [httpsarchive:runs .2014_09_01_requests] comme req JOIN (
SÉLECTIONNEZ DOMAINE (url) auto, pageid
De [httpsarchive:runs .2014_09_01_pages] ) comme pages ON pages.pageid = req.pageid
OÙ DOMAINE (req.url) != pages.self
GROUPE PAR MOST_REFERENCED
ORDRE PAR Desc total;[/note]

Il n’est pas surprenant, nous voyons plusieurs des précurseurs montrant sur les deux listes que Google, Akamai et Amazon cloudfront sont tous largement utilisés à la fois comme hôtes de contenu ainsi que des éléments supplémentaires référencés.

Ces données peuvent ne pas être une grande surprise pour personne, mais ces requêtes vraiment juste toucher à la pointe de l’iceberg. Vous pouvez écrire des requêtes plus complexes pour vraiment creuser dans les données d’analyse des performances web et identifier le contenu pertinent aux mesures de performances qui vous intéressent le plus.

Encore mieux est la possibilité d’utiliser une feuille de calcul comme votre front end à cette puissance de traitement du Big Data. BigQuery s’interface désormais avec Google Docs, permettant aux utilisateurs de voir et de partager les résultats rapidement et facilement , avec le patron, les collègues intéressés et plus encore.

Voici une grande vidéo de Google Developer Advocate Ilya Grigorik à Velocity l’année dernière qui détaille exactement comment commencer à utiliser HTTP Archive Data sur BigQuery. N’oubliez pas : la première étape consiste à obtenir votre test de performance Web de base pour votre propre site Web afin d’avoir des repères pour comparer vos propres analyses de performances web au reste d’Internet.

 

 

 

 

 

Latest Web Performance Articles​

Start Dotcom-Monitor for free today​

No Credit Card Required