fanf42<p><span class="h-card" translate="no"><a href="https://mastodon.xyz/@laetsgo" class="u-url mention" rel="nofollow noopener noreferrer" target="_blank">@<span>laetsgo</span></a></span> </p><p><a href="https://social.treehouse.systems/tags/admin" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>admin</span></a> <a href="https://social.treehouse.systems/tags/enshittification" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>enshittification</span></a> <a href="https://social.treehouse.systems/tags/IA" class="mention hashtag" rel="nofollow noopener noreferrer" target="_blank">#<span>IA</span></a> c'est un problème compliqué à traiter mais oui, c'est un sujet dans toutes les bouches du small web.<br>TL;dr: pas de bonnes solutions, mais les contres mesures avancent.</p><p>Déjà, ces bots ne respectent absolument pas les instructions de robots.txt que les bots de search eux respectent. En fait, n'importe quoi qui ressemble à des règles de bons fonctionnement ensemble est ignoré.</p><p><a href="https://thelibre.news/foss-infrastructure-is-under-attack-by-ai-companies/" rel="nofollow noopener noreferrer" translate="no" target="_blank"><span class="invisible">https://</span><span class="ellipsis">thelibre.news/foss-infrastruct</span><span class="invisible">ure-is-under-attack-by-ai-companies/</span></a></p><p>En fait c'est tellement pourri comme domaine, que des boites paie des créateurs de softs pour inclure dans leurs logiciel un botnet, ie un accès distant qui permet d'utiliser le smartphone/ ordinateur hôte comme relais, ce qui rend les défenses simple d'ip-ban inefficaces. Ces botnets sont massivement utilisés par les boite de LLM: <a href="https://jan.wildeboer.net/2025/04/Web-is-Broken-Botnet-Part-2/" rel="nofollow noopener noreferrer" translate="no" target="_blank"><span class="invisible">https://</span><span class="ellipsis">jan.wildeboer.net/2025/04/Web-</span><span class="invisible">is-Broken-Botnet-Part-2/</span></a></p><p>Bref, comment on de défend ?<br>Déjà, il ne faut pas sous estimé le travail ingrat de check/ban/throttling et toutes les mesures habituelles (et souvent très fastidieuses) mise en oeuvre par les admin sys.<br>Et sinon essentiellement, en rendant économiquement inetrerssant pour les bots de crawler certains endroits. C'est pas fou écologiquement (ça ressemble à mettre la clim pour compenser le chauffage déréglé), et les llm ont les poches profondes.<br>Mais pour l'instant on n'a pas mieux, on ne sait pas reconnaître un bot pour le banir, les boites de llm mettent énormément de r&d et "nos meilleurs cerveaux" (mais visiblement pas très fort en éthique) pour échapper aux détections.</p><p>On a quand même :</p><ul><li>des tar-pits, ie des pieges qui font boucler les bots dans un labyrinthe de texte plausible mais généré aléatoirement. Les boite d'IA détestent, et trouve rapidement des protection. Ex: népenthès: <a href="https://zadzmo.org/code/nepenthes/" rel="nofollow noopener noreferrer" translate="no" target="_blank"><span class="invisible">https://</span><span class="">zadzmo.org/code/nepenthes/</span><span class="invisible"></span></a></li><li>des pages de protection qui imposent un coût de calcul important. Le petit dernier qui fait un tabas, une réalisation de la géniale <span class="h-card" translate="no"><a href="https://pony.social/@cadey" class="u-url mention" rel="nofollow noopener noreferrer" target="_blank">@<span>cadey</span></a></span> : <a href="https://xeiaso.net/blog/2025/anubis/" rel="nofollow noopener noreferrer" translate="no" target="_blank"><span class="invisible">https://</span><span class="">xeiaso.net/blog/2025/anubis/</span><span class="invisible"></span></a></li></ul><p>Et j'espère beaucoup d'autres solutions bientôt. <br>Mais ça reste ad-hoc, et assez complexe à mettre en place... Mais le besoin est réel. En faut, les effets de bord des LLM se font même sentir au niveau des maintainers de logiciels libres, cf curl: <a href="https://www.linkedin.com/posts/danielstenberg_hackerone-curl-activity-7324820893862363136-glb1" rel="nofollow noopener noreferrer" translate="no" target="_blank"><span class="invisible">https://www.</span><span class="ellipsis">linkedin.com/posts/danielstenb</span><span class="invisible">erg_hackerone-curl-activity-7324820893862363136-glb1</span></a></p><p>Bref, le temps de la résistance n'est pas que politique.</p>