Início Tecnologia Alerta de ironia: citações alucinadas encontradas em artigos da NeurIPS, a prestigiada...

Alerta de ironia: citações alucinadas encontradas em artigos da NeurIPS, a prestigiada conferência de IA

10
0

Inicialização de detecção de IA GPTZero digitalizou tudo 4.841 artigos aceito pela prestigiada Conferência sobre Sistemas de Processamento de Informações Neurais (NeurIPS), que aconteceu no mês passado em San Diego. A empresa encontrou 100 citações alucinadas em 51 artigos que foram confirmados como falsos, disse a empresa ao TechCrunch.

Ter um artigo aceito pelo NeurIPS é uma conquista digna de currículo no mundo da IA. Dado que estas são as mentes líderes da pesquisa em IA, pode-se supor que usariam LLMs para a tarefa catastroficamente enfadonha de escrever citações.

Portanto, há muitas advertências com esta descoberta: 100 citações de alucinações confirmadas em 51 artigos não são estatisticamente significativas. Cada artigo tem dezenas de citações. Portanto, entre dezenas de milhares de citações, isto é, estatisticamente, zero.

Também é importante observar que uma citação imprecisa não nega a pesquisa do artigo. Como NeurIPS disse Fortunaque foi o primeiro a relatar a pesquisa do GPTZero: “Mesmo que 1,1% dos artigos tenham uma ou mais referências incorretas devido ao uso de LLMs, o conteúdo dos próprios artigos [is] não necessariamente invalidado.”

Mas, tendo dito tudo isso, uma citação falsa também não é nada. NeurIPS se orgulha de sua “publicação acadêmica rigorosa em aprendizado de máquina e inteligência synthetic”, diz. E cada artigo é revisado por várias pessoas que são instruídas a sinalizar alucinações.

As citações também são uma espécie de moeda para os pesquisadores. Eles são usados ​​como uma métrica de carreira para mostrar o quão influente é o trabalho de um pesquisador entre seus pares. Quando a IA os cria, ela diminui seu valor.

Ninguém pode culpar os revisores por não capturarem algumas citações fabricadas por IA, dado o grande quantity envolvido. GPTZero também é rápido em apontar isso. O objetivo do exercício period oferecer dados específicos sobre como os resíduos de IA se infiltram através de “um tsunami de submissões” que “sobrecarregou os pipelines de revisão dessas conferências até o ponto de ruptura”, o startup diz em seu relatório. GPTZero ainda aponta para um artigo de maio de 2025 chamado “A crise da revisão por pares da AI Conference” que discutiu o problema em conferências de estreia, incluindo NeurIPS.

Evento Techcrunch

São Francisco
|
13 a 15 de outubro de 2026

Ainda assim, por que os próprios pesquisadores não puderam verificar a precisão do trabalho do LLM? Certamente eles devem saber a lista actual de papéis que usaram em seu trabalho.

O que tudo isso realmente aponta é uma grande e irônica conclusão: se os principais especialistas em IA do mundo, com suas reputações em jogo, não conseguem garantir que seu uso de LLM seja preciso nos detalhes, o que isso significa para o resto de nós?

avots

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui