Muitas pessoas suspeitam que esses bots fazem parte do esforço de uma empresa de IA para coletar dados de treinamento de páginas da net. Em 2025, os bots de IA representaram uma parcela significativa do tráfego geral da net, que rastreiam a Web em busca de texto e outras informações para alimentar modelos de grandes linguagens que necessitam de dados.
Mas existem algumas diferenças importantes entre esses bots chineses e outros bots de IA. Primeiro, há simplesmente muito mais deles. King diz em seu web site que o tráfego da China e de Cingapura representa 22% do tráfego whole, enquanto todos os outros bots de IA representam menos de 10% combinados.
A maioria das empresas líderes de IA identifica claramente seus bots para os operadores de websites, o que também os torna mais fáceis de bloquear. Os laboratórios de IA de ponta “não estão tão interessados em fugir” das regras de bloqueio de bots, diz Brent Maynard, diretor sênior de tecnologia e estratégia de segurança da empresa de infraestrutura de Web Akamai. Ele diz que as empresas de IA geralmente só começam a tentar disfarçar seus bots depois que um web site fecha a porta. Essa onda de bots chineses, no entanto, se disfarçou desde o início como usuários humanos normais e até contornou as regras comuns de bloqueio de bots, disseram vários proprietários de websites à WIRED.
Além das empresas de IA, existem outras empresas incentivadas a explorar a Web, incluindo rastreadores de pesquisa e empresas de coleta de informações.
Custos crescentes e dados distorcidos
A boa notícia, pelo menos por enquanto, é que os bots não parecem ter um propósito explicitamente malicioso. Eles não foram publicamente conectados a nenhum ataque cibernético e não parecem estar procurando vulnerabilidades. Mas a falta de um motivo claro também aumenta a confusão.
Alguns proprietários de websites estão preocupados com o fato de os bots estarem escaneando materiais protegidos por direitos autorais sem permissão. Outros dizem que o aumento os forçou a pagar mais pela largura de banda, à medida que o tráfego de bots exclui os usuários humanos, ou a investir em ferramentas de prevenção mais sofisticadas. As visitas também distorcem a análise de tráfego, distorcendo os relatórios sobre quem está realmente visitando seus websites.
Mas os maiores impactos são sentidos pelas pessoas que obtêm receitas atraindo cliques em anúncios nos seus web sites. “Isso está destruindo minhas estratégias do AdSense”, diz Quintero, dono do weblog paranormal, “porque eles estão dizendo [your website is] visitado apenas por bots, então seu conteúdo não é algo valioso para o visualizador. Como resultado, websites como o dele podem ser vistos como menos desejáveis pelos anunciantes e penalizados pelo Google.
Soluções improvisadas
Muitas pessoas reclamaram do problema do bot de IA da China em canais de suporte on-line nos últimos meses ou enviaram mensagens sobre isso diretamente para seus provedores de hospedagem na net. Mas até agora, ainda existem poucas respostas concretas.
Contatado pela WIRED, o WordPress reconheceu que tem visto relatos nos últimos meses de que alguns de seus websites estão enfrentando aumento de tráfego de suspeitos de bots ou scrapers de IA. “Os websites WordPress sempre tiveram uma ótima estrutura que os torna fáceis de serem encontrados e indexados pelos mecanismos de busca. Esses mesmos recursos os tornam facilmente rastreáveis [by] IA também”, disse a empresa em um e-mail não assinado. Google, Cloudflare e Squarespace não responderam aos pedidos de comentários.











