mitago.net

Página web de Celso González

Filtro antispam para el awstats

El spam no solo te llega por correo, también tenemos el spam-referer que afecta a todos aquellos que tenemos un sistema de estadísticas que publica la web de la que viene el visitante.

El objetivo de estos spammers es que su sitio aparezca referenciado en muchos más para ganar peso en los buscadores, aparte de tocar los huevos ya que la página de estadísticas no es cacheada por ninguún buscador, o no debería de serlo ya que el robots.txt dice que no la indexen

robots.txt
User-Agent: *
Disallow: /cgi-bin/

Bien, durante este mes he tenido un ataque continuado con el objetivo de hacer que los referers apuntasen a sus páginas y he estado estudiando diferentes formas de hacerle frente

La primera esta usar la versión beta de awstats que ya incorpora un filtro de esta mierda, pero el software beta en servidores no me acaba de convencer

He visto opciones usando el mod_rewrite del apache como en spywareinfo pero tampoco me acababan de convencer de sus bondades

Asi que he recurrido a la navaja suiza de cualquier linuxero, un cutre shell-script (¿hay algo que no se pueda solucionar con eso?)

La idea es la siguiente, antes de procesar el logfile en el awstats se le pasa un filtro a base de sed y expresiones regulares que se encarga de limpiar la basura, no tiene mayor complicación

El script, si le sirve a alguien, lo podeis bajar de aqui mismo y antes de que me deis el premio al cat más inutil comentar que está puesto para dar mayor claridad

En el fichero de configuración del awstats hay que cambiar LogFile para que apunte a

LogFile="/ruta/filtro_antispam_awstats /var/log/apache2/access.log |"

Ojo a la barra | del final ya que es importante, con esto logramos que todos los malosos nos aparezcan bajo la agrupación de FiltroAntiSpam

-----

mié 14 diciembre 2005 03:231 comentarios