Lo que esconde la eliminación de la previsualización de resultados de Google

abril 26, 2013 — 8 Comments
Utiliza los ← → (cursores) del teclado para seguir leyendo el artículo

Ah! Trending Topic! Google ha sustituido la previsualización de resultados de Google.! Todo el mundo habla de ello sin entender la naturaleza de lo que ha pasado realmente y puedo estar equivocado, pero creo tener la llave que lo explica todo (a lo mejor me equivoco…). Creo que la eliminación de la previsualización de resultados en Google Chrome implica la eliminación de una incidencia que sobrecontaba visitas de analítica, de datos híbridos de los medidores oficiales (ComScore y Nielsen), de impresiones de adserver y…(leed, leed)

Un servidor, con la ayuda de varios analistas de medios como Rubén Gallardo, Adrían Segovia, Javier Ortiz y la inestimable colaboración de AT Internet con Cristina Lera y su ingeniero Thomas, logramos destapar una incidencia conocida por algunos, pero que afectaba a todos los sitios webs del mundo y que afectaba a la manera de contabilizar las visitas orgánicas desde google chrome a nivel de analítica web, a nivel de contabilización de datos híbridos de las herramientas de medición oficial (Nielsen, ComScore, Kantar) y también a nivel de conteo de impresiones de adservers (y quién sabe que más ha podido dar esto de si).

No quiero hacer un post quilométrico como el del diario Marca, sobretodo porque según GA el 50% lo leyó (o intentó leer via mobile -lo siento!) así que lo explicaré lo más simple posible para que sea fácil de entender. Pero me temo que va a ser largo y el tema lo merece.

Quiero puntualizar que esto que es voy a explicar lo “visionó” Frank Watson en Searchengineland (gracias Lluis Serra por pasarme el link) y es prácticamente el único artículo en internet que preveía lo que os voy a relatar.

Primera pista: migración de herramienta y discrepancias de datos

Grupo Godó decidió cambiar de herramienta de analítica web. Utilizábamos Site Catalyst y decidimos pasarnos a AT Internet. El cambio de herramienta significó un periodo de pruebas y testeos para comprobar que la nueva herramienta recogía toda la información correcta por igual en AT Internet.

AT INTERNET nos señala el camino: el problema se llama el pre render de Google Chrome

Observamos discrepancias en los datos que se reportaban en AT Internet vs Site Catalyst que no sabíamos entender y un ingeniero francés de AT nos puso sobre la pista del “pre-rendering” de Google Chrome, ya que las discrepancias eran sólo para las visitas orgánicas desde Google Chrome, la precarga de resultados y la consiguiente precarga de cookies de aquellos sites que tuvieran resultados en la primera posición de google o cuando el usuario realizaba la previsualización de un resultado concreto de la parrilla de Google.

El plugin de cookies de Chrome “Cookie awsome manager” nos lo demuestra

Un servidor empezó a realizar pruebas con el plugin de google chrome, llamado “awesome cookie manager” en el que se podía observar de forma concluyente que al realizar una búsqueda determinada, el primer resultado que aparecía posicionado, google chrome realizaba una precarga de todas sus cookies. O sea, que tanto si realmente pinchabas en el enlace o no, la cookie de analítica se activaba y te contaba como usuario/visita/pagina vista y lo mismo valía para las impresiones de tu adserver. (más tarde explicaré las excepciones y casos de uso de cada caso).

Era la noche del 24 de diciembre de 2012 y esto era la bomba.

  • ¿Algunas herramientas de analítica web sobrecontaban las visitas por culpa de la incidencia? ¿Y nos cobraban por ello sin avisarnos de forma explícita?
  • ¿Algunos adservers de publicidad sobrecontaban impresiones que los usuarios no veían realmente?
  • ¿Los datos de los medidores oficiales -Nielsen y ComScore y todos los demás mundiales- daban datos sobrecontados?.

Decidí llamar al maestro Adrían Segovia (AS) (disculpa Adrián por destrozarte la noche de Navidad) para ponerle al corriente de ésta anómala situación e unir fuerzas para realmente encontrar una explicación lógica y racional a este asunto. Llamé a Pedro Martínez (que pensaría que estaba loco de remate) para intentar localizar al bueno de Javier Ortiz (Unedisa) y decidimos incluir al master class técnico experto en herramientas de analítica, Rubén Gallardo (Prisacom).

  • ¿Fallaba el plugin de cookies awsome manager?
  • ¿O estábamos delante de un descubrimiento excepcional?

En la red apenas había documentación que reportara esta incidencia, así que la cosa prometía…

Cena de Navidad con analítica web de la buena

Después de varios intercambios de emails la noche de Navidad y de cenar con sus respectivas famílias, este grupo de locos analistas web entregados a la causa, nos pusimos a testear en cada una de nuestras herramientas la incidencia encontrada.

Personalmente hallé que la herramienta que utilizábamos, Site Catalyst, reconocía en algún lugar lejano de su blog y de forma “muy camuflada” esta incidencia y explicaba como arreglarlo: si tenías la versión v14, a través de un javascript (h24.4) o migrando directamente a la versión 15 de Site Catalyst. Dicho de otra manera, si tenías la versión v14 o anteriores y el javascript instalado la incidencia no te afectaba y si tenías la versión v15, menos. Pero muy pocos sabían de ello, Site Catalyst no lo había comunicado a sus clientes y por lo tanto, las posibilidades de que cada cliente hubiera subido ese javascript eran bastante remotas.

Pero no sólo Omniture padecía esta incidencia, sino otras herramientas como DAX, Site Census, Urchin estaban afectadas por el problema. SOLO GOOGLE ANALYTICS Y AT INTERNET (de pago) tenían el problema resuelto.

El problema se originó con el lanzamiento de la versión 13 de Google Chrome, entre junio y julio del 2011. A medida que Chrome fue ganando cuota de mercado, el alcance de todo esto es mayor.

¿Cual es el impacto real de la incidencia derivada de la previsualización de datos de Google Chrome?

¿Cual era el impacto de la previsualización de los datos de Google Chrome en los datos de analítica web?

Difícil de determinar y variará según cada tipo de web y la fuerza de su branding en buscadores y esta es la parte importante a analizar.

Primeramente determinar que el alcance de la incidencia era para las visitas orgánicas (seo)desde navegadores de google chrome, cada uno sabe lo que esto puede significar. Y de estas visitas orgánicas desde google chrome, aquellas en las que el usuario busque, encuentre el resultado y no acabe entrando.

Dos ejemplos con Omniture: lavanguardia.com y elmundo.es (pasa igual con elpais.com y cualquier otro site, repito, CUALQUIER OTRO SITE que en ese momento tuviera la versión anterior a Site Catalyst v.15 y no tuviera el javascript h.24 instalado para corregir el problema. Le pasaba a todos los clientes de Omniture con estas características a nivel mundial….

Busco en google.es “elmundo”, se me carga el resultado de “el mundo” obviamente y sin haber entrado en elmundo.es, el plugin de cookies me indica que se ha cargado la cookie de site catalyst (s_vi) en el navegador. Aún no he entrado en elmundo.es y plas! Ya me ha contado como usuario, me ha contabilizado una página vista y etc…

pre rendering elmundo

Ejemplo Lavanguardia.com, más de lo mismo….misma experiencia, misma herramienta, mismo resultado.

ejemplo lavanguardia

 

Tengo el pantallazo de la captura de la cookie de site catalyst cuando en google busqué directamente una url específica de nuestro site “la vanguardia cuentos-de-los-hermanos-grim.html”.

pre rendering la vanguardia

 

REPITO: PARA QUE A NADIE SE LE OCURRA SACAR UN TITULAR SENSACIONALISTA DICIENDO QUE SOLO LE PASA A ELMUNDO O A LAVANGUARDIA,  LE PASA A TODOS LOS SITES CON SITE CATALYST con las carácterísticas que vamos a describir a continuación.

Y MÁS CLARO AÚN: Esto no sólo le pasaba a los sites de Site Catalyst, sino a todos los que no usan Google Analytics o AT Internet. Los demás, todos sufrían de la incidencia de Google Chrome y el prerendering y por consiguiente sobrecontaban usuarios, visitas, páginas vistas e impresiones publicitarias.

¿COMO CALCULAR EL IMPACTO REAL DE TODO ELLO?

Creo que tendríamos que agrupar el impacto según el tipo de web:

a) Webs muy buen posicionadas con poco branding, considero que entre un 5-10%. ¿Porqué? Si eres un cracks del seo, pero tu dominio no tiene fuerza, el CTR medio será inferior y por lo tanto el sobreconteo de visitas seo desde Google Chrome superior.

b) Webs muy bien posicionadas con buen branding, considero que podrían tener entre un 1-3%. Al tener un buen branding, el CTR suele ser mayor, por lo tanto el % de usuarios que realizando una búsqueda y que no acaban entrando en tu dominio, es menor.

Otros tipos de impactos de la previsualización de datos de Google Chrome:

  • los datos de panel a nivel Español e Internacional están distorsionados en alguna medida, debido a que el híbrido de Comscore tampoco es capaz de filtrar la previsualización de los resultados y la carga de las cookies cuando el usuario no hace clic en google.
  • Sobre-costes de servidores de todas las webs del mundo (habremos descargado código que no ha solicitado el usuario).
  • Sobre-costes de adserver (habremos servido publi que los usuarios no han visto si tu adserver no tiene el filtro arreglado, por suerte en Godó, tenemos tecnología francesa y sí lo está).
  • Sobre costes de herramientas de analítica web (nos habrán cobrado server calls que no hemos consumido). Imaginad que un Adobe o un DAX, con sus millones de millones de server calls, que la incidencia sólo haya afectado un 1% de páginas vistas servidas, igual estamos hablando de haber “ganado” algún milloncete de euros gracias a la incidencia. Me consta que DAX ofreció devolver sobrecostes a sus clientes y también que algunos partners en España de Adobe rápidamente comunicaron a sus clientes como solucionar el problema (un año después), pero en el caso de Adobe no hubo ningún movimiento para devolver o compensar estas llamadas consumidas sin haberse convertido en visita.

La incidencia también afecta a la hibridación de datos de panel del mercado

Y…¿Si estaba técnicamente probado que algunas herramientas de analítica web sobre-conteaban las visitas….como resolvía la situación ComScore, Nielsen y otros?

Aquí entró Rubén Gallardo en acción quién logró demostrar técnicamente que tampoco el medidor único (ni Comscore, ninguno, las cosas claras, y aquí incluyo a Nielsen y otros) era capaz de filtrar las visitas sobre-conteadas. Rubén Gallardo de Prisacom ha jugado realmente un papel más que decisivo para poder avanzar hasta el análisis final del problema y le dejo a él el honor de relatar como lo justificó técnicamente. La decisión de Rubén ayudará a tener una medición justa y más verídica para el mercado.

De entrada, el tag que recoge el dato híbrido de Comscore también sufre de la incidencia de Google Chrome. Aquí un ejemplo basado en abc.es. Con lo cual, todos los sites del mercado que utilizan el tag híbrido de Comscore sufren de la incidencia.

pre render abc

Comscore y el mercado se mueven rápido

¿Como actuó Comscore? La verdad es que el medidor oficial se puso directamente en contacto con el mismo Google, entendiendo que debía ser el buscador quién resolviera esta incidencia, en lugar de obligar a toda la indústria a construir parches para filtrar sobreconteos o sobreimpresiones. ComScore fue ágil, más de lo que un servidor pensaba y siendo malpensado, considero que Google le ha hecho caso.

Google retira la previsualización de datos. Incidencia terminada. ¿Seguro?

Desaparecida la previsualización de resultados, desaparecen el sobreconteo de visitas e impresiones de muchas herramientas que no tenían método trabajado para solucionar el problema. Algunos no teníamos mucha fe en el movimiento de Google y la verdad es que han sido tan rápidos como ComScore.

Pero OJO! Explorer y Firefox también están a punto de introducir el pre rendering o previsualización de resultados!

Conclusiones

a) Casi nadie y cuando digo casi nadie lo hago a nivel MUNDIAL, se había percatado de esto. Y los pocos que lo sabían, lo habían tapado o habían ignorado la magnitud de la tragedia. Fallamos todos: Google por usar funcionalidades sin importarle el alcance de todo, algunas herramientas y adservers por no haber intuido la jugada, analistas que habrán visto incrementos en sus estadísticas y no lo habrán sabido descifrar correctamente, departamentos que habrán visto escalados en costes de infrasctructura y tampoco habrán analizado su origen, la OJD que audita los datos de DIRECT y que ni se percató de la jugada, tal como los medidores oficiales del mercado. Fallamos todos.

b) Repetimos para puntualizar, esto sucede desde la versión 13 de Google Chrome y arranca cerca de junio 2011.

Afecta a los sites con bajo CTR en resultados orgánicos de búsquedas en Google Chrome.

c) A partir de ahora, ninguna herramienta de analítica web debería tener las visitas y las impresiones de adservers sobrecontados por culpa de Google Chrome, tampoco las herramientas de panel y sus datos híbridos.

d) El problema, lejos de solucionarse va a empeorar….Explorer y Firefox están a punto de introducir la previsualización de resultados, con lo que decimos “adiós al pre rendering de Google Chrome y hola al de Explorer y Firefox! Chrome tiene una cuota entre el 30 y el 40% y el impacto dependerá de la cifra en el CTR que tengas de las visitas seo de este 30-40%. Ahora el impacto se cifrará en el CTR de las visitas seo de un 50-60% del total del tráfico que tengas de estos navegadores.

REFERENCIAS.

Quiero agradecer el trabajo de Ruben Gallardo (largas horas de testeos compañero y a quién brindo la oportunidad de hacer uso de su blog para detallar a nivel muy técnico todo el calibre de la incidencia ya que se la curró como el que más), Adrián Segovia (por devolverme la llamada la noche de NAVIDAD) y de Javier Ortiz en sus contribuciones.

Si hoy hiciera un “follow friday” se lo dedicaría a Ruben al que considero la persona más cualificada a nivel técnico en analítica web, la única capaz de montar por sí mismo una sistema de analítica propio e interno (lo hizo en Yell) y quién podrá relatar mucho mejor a nivel técnico todo lo que yo os explico. Si no le seguís en twitter, pinchar en el link, es uno de los cracks de PRISA.

Utiliza los ← → (cursores) del teclado para seguir leyendo el artículo

admin

Posts Twitter Google+

Hola! Me llamo Ferriol Egea y llevo ya más de 7 años dedicándome profesionalmente a la Analítica Web. Empecé en el Grupo Anuntis, me formé de verdad en Webanalytics y de momento soy Head of Analytics en La Vanguardia (Grupo Godó). Si te gusta lo que estás leyendo, quieres contactarme para cualquier tema (formación, conferencias, nuevos proyectos/ofertas, consejos..) contacta conmigo a través de linkedin o twitter, te responderé encantado!

8 responses to Lo que esconde la eliminación de la previsualización de resultados de Google

  1. Muy buen estudio. Enhorabuena por el trabajo y gracias por las horas dedicadas.

    Hay una herramienta que se llama Feedjit, que te muestra las visitas en tiempo real según van entrando en tu página. Te muestra en qué página entran de tu web, desde donde y con qué Keyword en el caso de un buscador.

    Hace tiempo también observé que cuando mostraba la previsualización, me aparecía una nueva visita en Feedjit, sin llegar a entrar en la página en cuestión.

    Tampoco me había parado a pensar en la repercusión de eso, pero bueno, era un hecho que estaba ahí.

    Es bueno saber de una forma demostrada qué es lo que lo causa gracias a vuestro trabajo.

    La verdad es que para las personas que paguen por impresiones en adServers, esto ha podido tener un impacto tremendo ya que el coste les habrá subido bastante sin ni siquiera poder obtener ningún tipo de beneficio de esas supuestas impresiones.

    Un saludo.

    • Yo creo que las herramientas de analítica han estado más en fuera de juego que los adservers. De todas formas, los que tengan mucho tráfico inflado tendrán menores CTRS, porque es tráfico sin clic o acción, por lo tanto se cuenta publi que no el usuario no ve nunca y que nunca podrá interactuar con dicha publi, por lo tanto tendrán ctr 0 y afectarán a la media.
      Pero ojo, es de 1 a 3% del total, que no es mucho y no afecta ni mucho menos a todos los adservers. Yo creo que los adservers franceses lo tienen solucionado y también el de Google.
      El resto no lo sé…

  2. Roberto Abizanda abril 27, 2013 at 4:35 pm

    Pues vaya solución eliminar una característica que mejora la experiencia del cliente, completamente ajeno a temas de mediciones.

  3. Gracias por el análisis Ferriol, por descubrirlo con AT y por todo el trabajo desarrollado con Rubén Gallardo que destapó todo este inédito asunto del que aún recuerdo mi perplejidad cuando lo comentamos.

    Se nos presentan desafíos varios en analítica, uno de ellos este del prerender o previsualización de resultados de Google, que parece solucionado en Chrome, pero que llegará para IE y Firefox, distorsionando estadísticas, desvirtuando CTRs en los adservers y generando sobrecostes en las herramientas de medición.

    El otro desafío es cómo los navegadores permiten el acceso a Internet en cuanto al tratamiento de cookies se refiere, en la recién acabada edición de OMExpo en Madrid, Rubén Gallardo expuso en una interesante ponencia cómo algunos navegadores como Safari bloquen el uso de cookies y cómo otros van a impedir el uso de cookies de tercera parte en sus configuraciones por defecto, sistema por el que se rigen las mediciones de buena parte de las herramientas de analítica web, y además están en marcha algunas iniciativas legislativas que solicitarán el consentimiento a los usuarios para el uso de las cookies, sumado a que el fenómeno creciente del borrado de cookies por parte de los usuarios.
    Además todos estamos midiendo en nuestros medios el incremento del “not provided” ya que Google no provee las keywords cuando la navegación se produce desde un entorno seguro si el usuario está identificado en algún servicio del gigante de Internet.

    En este entorno creo que en la industria deberíamos organizarnos para garantizar una buena medición (que es clave para que el mercado de la publicidad online tenga todo el rigor y las garantías que permitan una mayor cuota de inversión) y al mismo tiempo velar por la privacidad de los usuarios, en este sentido la rectificación de Google es un buen punto del que deberían tomar nota el resto de empresas por las implicaciones que en analítica pueden provocar estas acciones.

    Saludos, Gema

  4. Muchas gracias Ferriol y a todos los colaboradores por este artículo, sin duda esclarecedor.

    Muy de acuerdo también con Gema Mora, en que la importancia de los datos analíticos provenientes de SEO para el mundo de la publicidad es tan alta que se regular mucho mejorar esta medición.

    También me pregunto por qué Google no informó correctamente (o quizás los hizo, no sé…) de como podía afectar su nuevo sistema a la medición del tráfico ya que imagino que ellos lo sabrían..

Trackbacks and Pingbacks:

  1. Lo que esconde la eliminación de la previsualización de resultados de Google - abril 30, 2013

    […] 2 alma 9 Lo que esconde la eliminación de la previsualización de resultados de Google por Marvin en tecnología | blogs / webs hace […]

  2. Cajón de enlaces semanal nº4 | Periferia Digital - mayo 3, 2013

    […] – Lo que esconde la eliminación de la previsualización de resultados de Google | Ferriol Egea […]

  3. Medios de comunicación y procesos - Vseo - mayo 6, 2013

    […] Ferriol explicaba con muchísimo detalle el análisis que hizo sobre cómo identificó la precarga de la caché y el impacto que ha tenido en las mediciones de los medios. […]

Deja un comentario

*

Text formatting is available via select HTML.

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>