Cómo eliminar el tráfico spam de Google Analytics

Tweet about this on TwitterShare on Facebook0Share on Google+11Share on LinkedIn5

¿Has notado un aumento repentido de visitas procedentes de Rusia o EEUU? ¿Te llega tráfico con idioma (not set)?. Si alguna respuesta es afirmativa, es muy probable que tu cuenta de Analytics esté recibiendo spam.

Vamos a ver qué es lo que está sucediendo y plantearemos algunas posibles soluciones para deshacernos de este molesto tráfico de spam.

¿Qué es lo que está ocurriendo?

Para ello primero tenemos que hacernos una idea de cómo funciona Google Analytics: cuando creas una cuenta, Google genera un ID y guarda los datos de la cuenta en sus servidores. Y cada vez que alguien se conecta a tu página, se ejecuta el código de seguimiento y se envía información de la visita a la cuenta que tienes alojada en los servidores de Google.

Y lo que está ocurriendo es que hay gente (códigos ejecutados de forma aleatoria) que envían información de visitas falsas al ID de tu cuenta. Esta información no queda grabada en el log de visitas de tu servidor pero sí que aparece en Analytics.

Yo empecé a investigar al entrar a mi cuenta de Analytics, mirando en “Adquisión” > “Todo el tráfico” y luego “Referencias”:

trafico spam

Y en “Audiencia” > “Información geográfica” > “Russia” encontré la siguiente imagen:

trafico spam ruso

También puedes irte a Audiencia > Información geográfica > Idioma, donde encontré varias visitas con idioma “(not set)”.

Desde Samara Oblast y Moscú (desde Rusia, con amor) llegaron 184 visitas de tres únicos usuarios con un promedio de tiempo en el sitio de 7 minutos, 1,62 páginas vistas y un 65% de rebote. Excelentes cifras, si no fuese porque mi página es relativamente nueva y no está bien posicionada, y menos en Rusia. Además, ¿para qué iba a querer entrar Diminitri en mi web?.

Desde EEUU no se han currado tanto el código: 28 visitas de 28 usuarios diferentes con un rebote del 100% y que únicamente visitan una página (la de inicio):

trafico spam eeuu

¿Qué finalidad tiene este tipo de spam?

Cuando abres las URL´s que aparecen en Analytics pulsando “Adquisición” > “Todo el tráfico” > “Referencias“, nos podemos encontrar dos tipos de páginas: las que te redirigen a AliExpress y el resto.

spam aliexpress

Sí: para lo que han invertido en AliExpress, el site es un mojón. Este tipo de spam busca obtener beneficios a costa de llegar a miles de usuarios. Con que sólo uno de ellos haga una compra, habrán obtenido ingresos. La misma técnica intentan desde otras páginas como semalt.com o hulfintongpost.es.

¿Y cómo se elimina este molesto tráfico que es spam?

Hay varias opciones, pero voy a hablar únicamente de las más sencillas:

  • A) Crear un listado de exclusión de dominios de referencia. Hay que añadir manualmente y de uno en uno los dominios que queremos bloquear.
  • B) Crear segmentos personalizados en Analytics (o utilizando los que he compartido más abajo ;)
  • C) Bloqueando el spam mediante .htaccess.

El problema de las opciones A y C es que, aunque incluyamos todos los dominios que nos han spameado en el listado de exclusión, lo único que conseguiremos es bloquear esos dominios para que no vuelvan a aparecernos sus visitas “spam”. Pero las visitas que hayamos recibido se seguirán mostrando, con lo cual el problema no se resuelve del todo.

Nota: estos tres métodos son totalmente compatibles (e incluso complementarios).

A) Creando un listado para excluir dominios de referencia:

1) Nos vamos a Administrador > Propiedad > Información de seguimiento > Lista de exclusión de referencia:

Como crear un listado de exclusion de referencia

2) Nos aparecerá únicamente nuestro propio dominio en la lista, que es la configuración por defecto. Esto lo hacen para que el tráfico interno no cuente como tráfico de referencia. Añade a la lista los dominios desde los que recibes spam, uno a uno. Esta es mi lista:

  • darodar.com
  • econom.com
  • iloveitaly.com
  • blackhatworth.com
  • hulfingtonpost.com
  • priceg.com
  • linkis.com
  • zapmeta.es
  • bycontext.com
  • sharebutton.net
  • seoairport.com
  • cenoval.ru
  • bestwebsitesawards.com
  • o-o-6-o-o.com
  • humanorightswatch.org
  • simple-share-buttons.com
  • aliexpress.com
  • kabbalah-red-bracelets.com
  • addons.mozilla.org
  • googlsucks.com
  • theguardlan.com
  • Get-Free-Traffic-Now.com
  • torture.ml
  • buy-cheap-online.info
  • free-share-buttons.com

Hay que tener en cuenta que al introducir un dominio estamos bloqueando también todos sus subdominios. Por ejemplo, si bloqueamos darodar.com, también estaremos bloqueando todas las URL´s tipo “forum0456456.darodar.com”:

Como habrás observado, he incluido a Alí porque me llegaba spam desde s.click.aliexpress. También he añadido addons.mozilla.org a la lista porque iloveitaly me estaba enviando spam desde allí, como se puede apreciar en la siguiente imagen:

referral spam iloveitaly

Supongo que seguirán llegando nuevas inyecciones de referrer spam, así que iré añadiendo los dominios conforme los vaya detectando.

B) Creando segmentos personalizados

Para crearlos, ve al recuadro superior de “todas las sesiones” y pulsa en la esquina derecha para crear un nuevo segmento:
crear segmentos en analytics

En lugar de escoger un segmento de los listados, crea uno nuevo pulsando el botón naranja “Crear segmento”. Yo lo he creado estas tres configuraciones:

Segmento 1) Tráfico “sin contaminar”: Al crearlo, entra al apartado “opciones avanzadas” y edita las opciones avanzadas de la siguiente forma:

  • Excluye las sesiones que tengan como idioma “(not set), ru, ru-ru o it”. Esto lo hago para eliminar el tráfico ruso, italiano y el (not set). El idioma (not set) lo he añadido porque me huele raro que un visitante (su navegador) no tenga un idioma establecido.
  • Excluye las sesiones cuya fuente de referencia provenga de cualquier dominio del listado anterior, para que no los muestre en las gráficas. Esto no elimina el tráfico de spam, simplemente nos permite generar informes más limpios.

configuracion de segmento trafico limpio

Segmento 2) Tráfico spam

  • Para crear este segmento, lo más sencillo es pulsar sobre el segmento creado y copiarlo. Usa los mismos filtros pero cambiando “excluir” por “incluir”. Así podrás ver los datos del tráfico de spam.

trafico spam analytics

Segmento 3) Tráfico español

Este es el más sencillo de crear y puede que el más eficaz, al menos de momento. Como mi site únicamente está en español, aunque pueda recibir visitas de guiris vía Twitter, las métricas que realmente me importan son las de los visitantes españoles. Además, estoy recibiendo spam con idioma inglés. Para crearlo:

  • Crea un nuevo segmento e incluye únicamente las sesiones cuyo idioma empiece o acabe por “es”.

¡Listo! Ya tienes tus segmentos personalizados. Pero ten en cuenta que cada vez que abras de nuevo tus informes de Analytics, los segmentos “desaparecerán“.

Para volver a mostrarlos, pulsa de nuevo en “todas las sesiones” > “Personalizados”. Selecciona los que quieras y listo. ¿Que porqué hay que hacerlo cada vez que quieras ver esos segmentos? Eso pregúntaselo a Google… xD.

Bájate los segmentos ya creados para modificarlos a tu gusto

Puedes bajarte cualquiera de los tres filtros (o los tres) directamente. O si lo prefieres, puedes ver la descripción que he creado en la galería de Google y bajártelos y compartirlos desde allí.

plantilla para eliminar el tráfico  spam en analytics

Al descargarlo, te pedirán que escojas el sitio al que quieres añadir esos segmentos. Una vez guardado, únicamente tendrás que pulsar en “Informe” > “Todas las sesiones” > “Personalizados”. Selecciona los segmentos que quieras y listo.

seleccionando segmentos personalizados en analytics

Y aquí podéis ver el resultado. En la primera imagen, el tráfico spam está representado por la línea naranja:

datos de trafico spam y trafico español

Y aquí el promedio de páginas vistas y el porcentaje de rebote:

porcentaje de rebote del trafico spam

Y el número de páginas vistas por idioma, donde he remarcado el (not set).

paginas vistas por idioma

C) Bloquear los ataques de spam mediante .htaccess

Edita el fichero .htaccess y añade los referrals spam de la siguiente forma:

SetEnvIfNoCase Referer semalt.com spambot=yes
SetEnvIfNoCase Referer darodar.com spambot=yes
SetEnvIfNoCase Referer buttons-for-website.com spambot=yes

#(y así con todos los dominios que quieras bloquear). Y termina así:

Order allow,deny
Allow from all
Deny from env=spambot

Si decides editar tu .htaccess, hazlo con cuidado: como introduzcas mal algún carácter, tu página puede dejar de funcionar hasta que arregles el error.

Conclusiones

  • Bloquear dominios en la lista de exclusión de referencia no resulta efectivo porque no borra las visitas de spam, simplemente bloquea las futuras. Para visualizar correctamente los datos, una opción sencilla es crear segmentos personalizados (o importar alguno que ya esté hecho ;).
  • Los spammers van mejorando. El tráfico de spam al principio era del tipo “1 página vista, 0 segundos en el sitio y mayormente procedente de Rusia”. Pero parece que los spammers van aprendiendo. Fijaos en el promedio de tiempo en el sitio y páginas vistas del tráfico marcado como spam en las imágenes superiores.
  • Ahora también spamean con tráfico directo y con idioma (not set). ¿Qué navegadores no son capaces de detectar ni establecer un idioma predeterminado?.

De momento, parece que esto afecta mayormente a sitios pequeños y medianos, porque las cifras no son muy altas, al menos en los casos que he visto.

¿Conoces alguna otra forma sencilla de deshacerte del tráfico de spam?¿Conoces algún otro dominio que se pueda agregar a esa lista de exclusiones? ¡Dínoslo aquí!

Tweet about this on TwitterShare on Facebook0Share on Google+11Share on LinkedIn5

26 comentarios en “Cómo eliminar el tráfico spam de Google Analytics

  1. No, porque esas visitas no aparecen en el log del servidor, donde se registra la IP desde la que accede cada visitante.

    Cuando alguien visita una página que tiene código seguimiento de Google Analytics, este código se ejecuta. Y al abandonar la página, se envían los datos que genera ese código (tiempo en la página, páginas vistas y demás) a la cuenta de Analytics de esa página.

    Lo que hace el referrer spam es enviar “señales falsas” (códigos de Analytics ejecutados) a tu cuenta (con ID tipo UA-755…).

  2. Gracias por este artículo, me fué muy util ya que gestiono 6 páginas y en todas me aparecen visitas y % de rebote altos por esta razón. MUY UTIL

  3. Gracias a tí por el comentario, me alegro de que te haya sido de utilidad. Como puedes ver, acabo de actualizar el artículo porque sigo recibiendo referrer spam y he añadido dos nuevas URL´s a la lista de exclusión.
    Saludos

  4. Muy útil. Me tenían frito las visitas desde Rusia a mis páginas nuevas. Pensaba que era un problema de indexación de Google que todavía no me había ubicado en el mapa.

  5. Yo en un principio también pensé algo parecido, y la verdad es que fastidia bastante que cambien los números reales de Analytics.
    Me alegro de que te haya sido útil.

  6. Muchas gracias por el post, yo también me estaba volviendo loca con las visitas fantasma desde la remota ciudad de Samara. Me han llegado también visitas desde googlsucks.com, por si lo quieres añadir a la lista.¡Gracias!

  7. Vaya por delante que soy muy profano en la materia y me estoy iniciando en el tema. Según leo solo es válido para Universal Analytics, que entiendo que debe ser una versión algo diferente a la de Google Analytics pelada y gratuita. Es así? Lo digo porqué he aplicado los dominios en la lista y me siguen apareciendo las malditas visitas de Rusia. Alguna ayuda, por favor? Muchas gracias, sobre todo al autor del articulo.

  8. De lo dicho anteriormente, olvídalo. Lo único que me sucede es que no se me aplica esta restricción a pesar de haber copiado todos los dominios en el sitio correspondiente. A que puede darse este problema?

  9. Genial el artículo. Sólo me queda una duda, aunque he añadido a la lista de exclusión todas las direcciones que me aparecían en los informes, me siguen saliendo cuando pido un informe por un periodo de tiempo largo. Es imposible quitarlas? no sé si me explico… cuando se añaden las direcciones se eliminan de todos los informes ofreciendo un resultado más real o por el contrario es de ahora en adelante cuando dejarán de aparecer?

    muchas gracias por el post!

  10. Hola Jose,

    Una consulta ya he modificado el .htaccess
    pero me sigue las visitas de algunos sitios que estan en el listado por ejemplo:
    webmonetizer.net
    www.event-tracking.com
    www.Get-Free-Traffic-Now.com

    Le debo añadir las www?
    porque sigo teniendo visitas de estos tres sitios

    Muchas Gracias por el aporte

    Saludos

  11. Muchas gracias, este artículo ha sido muy muy útil. ¡Tenía 90 en mi lista de Spam!El que necesite se la paso.
    Hay un tema que me sigue preocupando, tengo un rebote en Tráfico directo de 88,98.

  12. ¿En palabras clave orgánicas tengo (no set) y (not provide), también es Spam?
    Muchas gracias Jose Miguel, en serio que muy útil tu web.

  13. Buenas, eso únicamente previene los nuevos ataques de spam desde esos dominios, pero no borra los anteriores. Para visualizar el tráfico “limpio” debes crear filtros personalizados, como indico en el post. Saludos.

  14. Me alegro de que te haya servido el artículo. Sobre el rebote del tráfico directo, fíjate en la procedencia de las visitas. Como dije en el post, yo también estoy recibiendo spam por tráfico directo. Fíjate en la procedencia geográfica del tráfico directo: muchas de esas visitas tienen como procedencia (not set), al menos así ocurre en mi caso. Y me temo que esas visitas también son spam, por eso las incluí en los filtros personalizados que he compartido en el post.
    Saludos.

  15. En palabras clave orgánicas el not provided es totalmente normal. Ya hace tiempo que Google no te dice en Analytics las palabras clave por las que llegan a tu página, y no es raro ver porcentajes del 90% en not provided.

  16. Hola jose creo que el de trafico sin contaminar no sirve porque hay trafico spam que me aparece de estos sitios
    1. e-buyeasy.com
    Tráfico con idioma español
    0 (0,00 %)
    0,00 %
    0 (0,00 %)
    0,00 %
    0,00
    00:00:00
    0,00 %
    0 (0,00 %)
    0,00 $ (0,00 %)
    Tráfico sin contaminar
    3 (9,38 %)
    100,00 %
    3 (9,38 %)
    100,00 %
    1,00
    00:00:00
    0,00 %
    0 (0,00 %)
    0,00 $ (0,00 %)
    2. www.event-tracking.com
    Tráfico con idioma español
    0 (0,00 %)
    0,00 %
    0 (0,00 %)
    0,00 %
    0,00
    00:00:00
    0,00 %
    0 (0,00 %)
    0,00 $ (0,00 %)
    Tráfico sin contaminar
    17 (53,12 %)
    100,00 %
    17 (53,12 %)
    0,00 %
    0,00
    00:00:00
    0,00 %
    0 (0,00 %)
    0,00 $ (0,00 %)
    3. www.Get-Free-Traffic-Now.com

  17. Muchas gracias por este post. Nos ha resultado muy instructivo y detallado. Justamente nosotros tenemos el mismo problema.
    Respecto a la lista de dominios a excluir, fantástica ayuda, cómo podemos saber qué otros dominios, que no estén en la lista, podemos considerar spam?.
    En nuestro caso, adjunto otro dominio que a nosotros nos muestra muchas visitas y que, buscando en la red, hemos confirmado que se trata de spam: floating-share-buttons.com.
    Saludos

  18. Buenos días.
    Lo primero, darte las gracias por este post, me ha servido de mucha ayuda.

    Tengo una duda.

    En:
    “Segmento 1) Tráfico “sin contaminar”.
    Excluye las sesiones cuya fuente de referencia provenga de cualquier dominio del listado anterior, para que no los muestre en las gráficas. Esto no elimina el tráfico de spam, simplemente nos permite generar informes más limpios.”

    Esto quiere decir que tenemos que introducir todos los dominios del listado o que introduciendo el primero tendrá en cuenta el resto de dominios del listado?
    Muchas gracias y un saludo :)

  19. Uffff!! Muchísimas gracias por este artículo!! hemos lanzado el sitio web hoy mismo y las visitas desde Rusia me tenían loco y me iban a romper todas las mediciones!

    Así que muchas gracias de nuevo :) voy a ver cómo puedo dar publicidad a este artículo

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *