Excavando profundamente en Análisis de rendimiento web con HTTP Archive y BigQuery

Como desarrollador web o miembro del equipo de TI, nunca podrá tener demasiados datos que detallen el rendimiento de su sitio web y cómo se comparan con otros en toda la industria. Una forma sencilla de entender cómo se compara el rendimiento de su sitio web con un muestreo cruzado de Internet toma solo tres pasos:

  1. Ejecute una línea base de rendimiento web en su sitio utilizando una herramienta como la prueba de velocidad del sitio webde Dotcom-Monitor.
  2. Ejecute una consulta en los 100 o 1000 sitios web principales utilizando las herramientas de HTTPArchive.
  3. httpsArchive.org
  4. Compare los datos para ver dónde se encuentra frente a la industria.

Esto le proporciona una gran visión de los análisis generales del rendimiento web y los promedios, pero no puede profundizar en los detalles. El conjunto de datos capturado por HTTP Archive es enorme, más de 400 GB. Sin embargo, si prospera en el afeitado milisegundos desde un tiempo de carga de página, desea tener acceso a la mayoría de los datos posibles.

Análisis de rendimiento web en sus dedos

Ahora, el conjunto de datos completo de HTTP Archive ya está disponible en BigQuery, una herramienta de Google que permite a los desarrolladores o a cualquier otra persona interesada en el análisis comparativo analizar big data en la nube. Los usuarios pueden ejecutar consultas de tipo SQL en conjuntos de datos enormes y obtener resultados en cuestión de segundos. Ahora puede profundizar en los datos detallados de análisis de rendimiento web y descubrir matices perspicaces sobre el rendimiento del sitio web usted mismo. Si aún no lo has probado, te lo estás perdiendo; puede convertir los números de rendimiento web en el contenido de su corazón y obtener un análisis en profundidad de dónde encaja su sitio en la mezcla.

Por ejemplo, puede ejecutar consultas realmente básicas en grandes conjuntos de datos y recibir resultados inmediatamente. Ejecutamos una consulta para determinar las 10 redes de distribución de contenido más populares con la siguiente consulta:

[note note_color=”#e7e7e7″]SELECT cdn, Count(cdn) as Count FROM Web Performance Analytics - Top 10 DCN[httpsarchive:runs .2014_09_01_pages] WHERE cdn <> “” GROUP BY cdn ORDER BY Count Desc;[/note]

que devolvió los siguientes resultados:

Al pensar en las CDN más referenciadas, también nos preguntamos qué sitios en general alojan el material más referenciado (como el código de seguimiento para análisis, etc.), por lo que ejecutamos la siguiente consulta para recuperar esta información:

[note note_color=”#e7e7e7″]SELECT DOMAIN(req.url) Most_Referenced, COUNT(*) TotalMost Referenced - HTTP Archive and BigQuery
FROM [httpsarchive:runs .2014_09_01_requests] as req JOIN (
SELECT DOMAIN(url) self, pageid
De [httpsarchive:runs .2014_09_01_pages] ) como páginas EN pages.pageid – req.pageid
DONDE DOMINIO(req.url) !- pages.self
GRUPO POR Most_Referenced
PEDIDO POR Total desc;[/note]

No es de extrañar que veamos varios de los precursores que aparecen en ambas listas, ya que Google, Akamai y Amazon Cloudfront se utilizan ampliamente como hosts de contenido, así como elementos de referencia adicionales.

Estos datos pueden no ser una gran sorpresa para nadie, pero estas consultas realmente sólo tocan en la punta del iceberg. Puede escribir consultas más complejas para profundizar realmente en los datos de análisis de rendimiento web e identificar el contenido relevante para las métricas de rendimiento que más le interesan.

Aún mejor es la capacidad de usar una hoja de cálculo como su front-end a esa potencia de procesamiento de big data. BigQuery ahora interactúa con Google Docs, lo que permite a los usuarios ver y compartir resultados rápida y fácilmente, con el jefe, compañeros de trabajo interesados y más.

Aquí hay un gran video de Google Developer Advocate Ilya Grigorik en Velocity el año pasado que detalla exactamente cómo empezar a usar HTTP Archive Data en BigQuery. No lo olvide: el primer paso es obtener su prueba de rendimiento web de referencia para su propio sitio web para que tenga puntos de referencia para comparar sus propios análisis de rendimiento web con el resto de Internet.

 

 

 

 

 

Latest Web Performance Articles​

Top 10 Synthetic Monitoring Tools for 2024

When it comes to ensuring your website’s performance and uptime, synthetic monitoring tools have become indispensable. These tools help businesses proactively detect and resolve issues

Start Dotcom-Monitor for free today​

No Credit Card Required