Errores 404 y mod_speling
Revisando las estadísticas de accesos fallidos a la página web he podido comprobar que fundamentalmente son debidos a 4 tipos de error
Rutas relativas incorrectas Normalmente fallo mío y que cuando lo detecto lo soluciono al momento, otras veces es debido a alguno de los scripts que empleo que no funcionan y cuyo arreglo es más costoso, por ejemplo los comentarios y otras veces es debido a que en algún fichero de código aparece alguna ruta y los buscadores intentan seguirla
Carácteres extraños. Tengo unos cuantos enlaces como "Mondoñedo", "Navideña" o "L'Ofre" que hacen que recurrentemente tenga errores al intentar acceder a estos sitios. Ahora ya lo se y evito introducir este tipo de información y con los que ya tengo no he pensado ninguna solución por el momento
Robots automáticos Son las famosas entradas de /_vti_bin/owssvr.dll o /MSOffice/cltreq.asp o /adxmlrpc.php. Programas que buscan estos ficheros o bien bots infectados o que buscan una vulnerabilidad en alguno de estos ficheros. Nada que hacer con ellos
Mayúsculas y minúsculas Aquí es dónde yo quería llegar, en mi caso tengo un directorio Fotos, pero mucha de las peticiones que me llegan buscan el directorio fotos, con la f en minúscula. Pues la solución para esto se encuentra en este módulo de apache
mod_speling
Tan sencillo como activarlo en mods-enabled en debian o añadir a nuestro fichero de configuración
LoadModule speling_module /usr/lib/apache2/modules/mod_speling.so
Después lo único que nos resta es habilitar el módulo en los virtual hosts, los directorios o en la configuración global usando la directiva:
CheckSpelling on
Como es de suponer este módulo implica una penalización en el rendimiento, pero gracias a él podemos reducir el número de peticiones fallidas