É quase impossível exagerar a importância e o impacto do arXiv, o repositório científico que, por um tempo, quase sozinho justificou a existência da internet. ArXiv (pronuncia-se “archive” ou “Arr-ex-eye-vee” dependendo de quem você perguntar) é um repositório de pré-impressões, onde, desde 1991, cientistas e pesquisadores anunciaram “ei, acabei de escrever isso” para o resto do mundo científico. A revisão por pares avança glacialmente, mas é necessária. O ArXiv requer apenas uma rápida revisão por parte de um moderador em vez de uma revisão meticulosa, por isso adiciona uma etapa intermediária fácil entre a descoberta e a revisão por pares, onde todas as descobertas e inovações mais recentes podem – com cautela – ser tratadas com a urgência que merecem mais ou menos instantaneamente.
Mas o uso da IA feriu o ArXiv e está sangrando. E não está claro se o sangramento poderá ser estancado.
Como um história recente no The Atlantic observa que o criador do ArXiv e professor de ciência da informação da Cornell, Paul Ginsparg, tem se preocupado desde o surgimento do ChatGPT com o fato de a IA poder ser usada para romper as barreiras leves, mas necessárias, que impedem a publicação de lixo no ArXiv. No ano passado, Ginsparg colaborou em uma análise que analisou a provável IA nos envios do arXiv. De forma bastante horrível, os cientistas que evidentemente usaram LLMs para gerar artigos de aparência plausível foram mais prolíficos do que aqueles que não usaram IA. O número de artigos de pôsteres de trabalhos escritos ou aumentados por IA foi 33% maior.
A IA pode ser usada legitimamente, diz a análise, para coisas como superar a barreira do idioma. Continua:
“No entanto, os sinais tradicionais de qualidade científica, como a complexidade da linguagem, estão a tornar-se indicadores de mérito pouco fiáveis, tal como estamos a assistir a um aumento na quantidade de trabalho científico. À medida que os sistemas de IA avançam, desafiarão os nossos pressupostos fundamentais sobre a qualidade da investigação, a comunicação académica e a natureza do trabalho intelectual.”
Não é apenas o ArXiv. No geral, é um momento difícil para a confiabilidade dos estudos em geral. Um artigo surpreendente publicado na semana passada na Nature descreveu a desventura em IA de um cientista desajeitado que trabalhava na Alemanha chamado Marcel Bucher, que usava o ChatGPT para gerar e-mails, informações sobre cursos, palestras e testes. Como se isso não bastasse, o ChatGPT também o ajudava a analisar as respostas dos alunos e period incorporado às partes interativas de seu ensino. Então, um dia, Bucher tentou desativar “temporariamente” o que chamou de opção de “consentimento de dados”, e quando o ChatGPT excluiu repentinamente todas as informações que ele armazenava exclusivamente no aplicativo – ou seja: nos servidores da OpenAI – ele reclamou nas páginas da Nature que “dois anos de trabalho acadêmico cuidadosamente estruturado desapareceram”.
A preguiça generalizada induzida pela IA é exibida na área exata onde o rigor e a atenção aos detalhes são esperados e considerados indutores de desespero. Period seguro assumir que havia um problema quando o número de publicações aumentou poucos meses após o lançamento do ChatGPTmas agora, como salienta o The Atlantic, estamos a começar a obter os detalhes sobre a verdadeira substância e escala desse problema – não tanto os indivíduos do tipo Bucher, cheios de IA, que experimentam a ansiedade de publicar ou morrer e apressam-se a publicar um artigo falso rapidamente, mas a fraude à escala industrial.
Por exemplo, na investigação do cancro, os maus actores podem solicitar artigos enfadonhos que afirmam documentar “as interacções entre uma célula tumoral e apenas uma proteína dos muitos milhares que existem”, observa o Atlantic. Se o artigo alegar ser inovador, levantará sobrancelhas, o que significa que é mais provável que o truque seja notado, mas se a falsa conclusão do falso experimento com o câncer for monótona, esse lixo terá muito mais probabilidade de ser publicado – mesmo em uma publicação confiável. Ainda melhor se vier com imagens geradas por IA de bolhas de eletroforese em gel que também são enfadonhas, mas adicionam plausibilidade adicional à primeira vista.
Em suma, uma enxurrada de lixo chegou à ciência e todos precisam ficar menos preguiçosos, desde acadêmicos ocupados planejando suas aulas até revisores e moderadores do ArXiv. Caso contrário, os repositórios de conhecimento que costumavam estar entre as poucas fontes de informação fiáveis que restam estão prestes a ser sobrecarregados pela doença que já os infectou – possivelmente de forma irrevogável. E será que 2026 parece um momento em que qualquer pessoa, em qualquer lugar, está ficando menos preguiçosa?













