Analítica web y cuentos chinos


Sin categorizar

Ayer 23 de enero, en China decían adiós al año del conejo para celebrar la entrada del año del dragón. Los chinos suelen aprovechar la celebración de su Año Nuevo para tomarse unos días de vacaciones, entre enero y febrero se producen millones de desplazamientos dentro de China.

La semana pasada salía en todos los diarios online, en las noticias de La 1 y en muchos blogs un titular de este tipo: ‘La web más visitada del mundo es china’, y afirmaciones como ésta:

La página web alberga alrededor de 1.000 millones de visitantes únicos diarios, los últimos datos reflejan que entre el 5 y 9 de enero registró hasta 1.400 millones de visitas, algo sorprendente, a lo que se le añade que un 1% de los cibernautas ha paseado alguna vez por su dominio, aquí. (Por cierto un 1% de los internautas mundiales son unos 20 millones de personas.)

La web en cuestión es la web de venta de billetes de tren www.12306.cn y la noticia original viene de Global Times. En el titular hablan de 1.000 millones de clics (1 billion en inglés), y en el cuerpo de la noticia se refieren a hits: 1 billion hits during the first week of January, according to a railway official.

Los medios y blogs que se hicieron eco de la noticia tradujeron ese hits, bien en ‘visitas’ o en ‘clicks’, así ya tenían su titular jugoso: ‘Una web de venta de billetes de tren china tiene más de 1.000 millones de visitas en 1 día’.

Errores por parte de los medios y bloggers

A los medios y a gran parte de bloggers nacionales les faltaron tres cosas:

  • Comprobar que un hit no es una visita. La traducción de hits ha sido libre, nadie se ha preocupado de preguntarse qué es un hit.
  • Profundizar y comprobar que la noticia no es tan espectacular. La misma web china de noticias Gobal Times, días más tarde publicaba que la web de venta de billetes de tren es monopolio del estado y que es imposible comprar un billete de tren online en China sin pasar por esa web. El número de peticiones fue tan brutal que la web no pudo dar servicio a todos los usuarios que querían comprar un billete.

Hacemos ahora el análisis que los periodistas podrían haber hecho a la hora de publicar la noticia:

1) No todos los chinos con acceso a Internet se conectan cada día.

2) Hits, clics, visitas y visitantes únicos son cosas distintas, como debe saber cualquier periodista que publique sobre Internet.

3) 1.000 millones de visitas en un día para 384 millones de internautas suponen casi un promedio de 2,6 visitas a la web ese día para toda persona con acceso a Internet en China (2,4 si tomamos la estimación de 415 millones de personas conectadas). Muy improbable.

4) Si analizamos la home, vemos que tiene 56 componentes –imágenes, archivos de código, hojas de estilo, etc.-. Es decir 56 hits para una primera visita a la home. El número de hits por visita puede ser muy variable según cómo esté programada la web y cuál sea el promedio de páginas por visita. Si suponemos un cálculo modesto de 2,5 páginas por visita y unos 40 hits por página, eso nos da que los 1.000 millones de hits se traducen en 25 millones de páginas vistas y 10 millones de visitas. Nada que ver con los titulares.

5) ¿Clics o hits? Es más probable que sean hits –que es la unidad base de los programas que analizan el tráfico web en el servidor- que clics. 1.000 millones de clics, si es que son clics, es difícil saber en qué se traducen en un proceso de reserva ¿cuántos clics son necesarios para comprar un billete de tren? ¿cómo se miden esos supuestos clics?, o incluso ¿es positivo que un proceso de compra registre tal número de clics?

Nuestra estimación no tiene por qué se exacta, pero el resultado con cualquier estimación razonable nos da un resultado dos órdenes de magnitud por debajo, si los datos de partida son correctos.

La noticia ha circulado mucho y, como de costumbre, la mayor parte de los medios se han limitado a copiar y a añadir algún comentario que la hiciese más espectacular. Embolica que fa fort. Como en el chiste de Eugenio, hay mucho chino en China, y parece que sólo nos interesan noticias espectaculares que reflejen el poder creciente de China y de su mercado. Que sean verdaderas o no, es lo de menos.

Por otra parte, no era necesario profundizar mucho para ver que la noticia no era tal, y que la anécdota nos podría llevar tanto a profundizar en estudios sobre el uso de Internet en China, como a hablar del monopolio estatal en la venta de este tipo de servicios. Tampoco parecen haber tenido en cuenta la vinculación de Global Times con el Partido Comunista Chino.

Y otro dato fácil de obtener que desmiente que sea la web más visitada del mundo, ni siquiera un único día, usando la misma fuente de citaban algunos de los medios: Alexa.

Veamos el tráfico del último mes

Tráfico del último mes

a) comparado con Google y Wikipedia

Comparativa Google y Wikipedia

b) Comparado con las tres webs más visitadas en China según Alexa (para evitar el sesgo que Alexa pueda tener a webs internacionales como Google o Wikipedia)

Comparativa con las 3 webs más visitadas de china

En el día en que 12306.cn más tráfico tuvo, se quedó en una décima parte del tráfico de Baidu, y en cincuenta veces menos tráfico que Google. Alexa no es exacto, pero es difícil que cometa errores de esta magnitud.

Quien quiera seguir leyendo sobre los malabarismos que algunos medios de comunicación hacen con los números para llegar a la conclusión que quieren, o peor, a la más sensacionalista, puede seguir con el artículo de Mala Prensa sobre el milagroso efecto del cierre de Megaupload en la recaudación de los cines americanos.

Y siguiendo con la misma línea podríamos retitular el anuncio de recesión para este año de la economía española por parte del FMI y del Banco de España como: “En 2012 España mantendrá el 98,5% de su riqueza”. Y tan contentos.