Ibrahim Diallo, un programador experto en desarrollo web, ha revelado en su blog una estrategia radical, pero efectiva, para proteger su servidor del constante acoso de bots automáticos, especialmente de aquellos utilizados por compañías de IA para alimentar modelos de lenguaje a gran escala. ¿La solución? Una trampa digital disfrazada de archivo comprimido: una bomba ZIP.
Una amenaza silenciosa
Diallo parte de una observación inquietante: la mayor parte del tráfico en la Web ya no proviene de humanos, sino de bots. Algunos de ellos son benignos, como los de motores de búsqueda o lectores RSS. Otros, sin embargo, no lo son tanto: entre ellos se encuentran bots diseñados para escanear vulnerabilidades de seguridad, inyectar scripts maliciosos, extraer contenido sin permiso (scraping) o incluso reclutar servidores para redes de ataques DDoS.
En el caso de los bots para el entrenamiento de IA, éstos no sólo han mostrado una desmesurada avidez en el consumo de información actualizada (hasta tal punto que han llegado a poner en riesgo la estabilidad de los servidores de la Wikipedia, por ejemplo), sino que acceden a los sitios web ignorando deliberadamente los mecanismos habituales de denegación de permiso usados por los webmasters.
Normalmente, a través del tradicional fichero 'robots.txt' (las webs de IA no tienen obligación legal de respetarlo, pero se considera una cuestión de netiqueta):
Así que, ante la violación de esa netiqueta por parte de los bots, Diallo decidió contraatacar.
El arma: compresión contra compresión
Diallo aprovecha una tecnología …