Siga ZDNET: Adicione-nos como fonte preferencial no Google.
Principais conclusões da ZDNET
- As alucinações de IA persistem, mas a precisão está melhorando nas principais ferramentas.
- Perguntas simples ainda expõem erros surpreendentes e inconsistentes de IA.
- Sempre verifique as respostas da IA, especialmente para fatos, imagens e informações jurídicas.
Uma das falhas mais frustrantes das ferramentas generativas de IA atuais é simplesmente interpretar os fatos de maneira errada. As IAs podem ter alucinações, o que significa que as informações que fornecem contêm erros factuais ou outros erros.
Normalmente, os erros vêm na forma de detalhes inventados que aparecem quando a IA não consegue responder a uma pergunta de outra forma. Nesses casos, tem de conceber algum tipo de resposta, mesmo que a informação esteja errada. Às vezes você pode detectar um erro óbvio; outras vezes, você pode não ter consciência dos erros.
Também: Pare de dizer que a IA alucina – isso não acontece. E a descaracterização é perigosa
Eu queria ver quais ferramentas de IA se saíam melhor no fornecimento de respostas precisas e confiáveis. Para isso, verifiquei várias das principais IAs, incluindo ChatGPT, Google Gemini, Microsoft Copilot, Claude AI, Meta AI e Grok AI.
Alimentei cada um com a mesma série de perguntas para ver como respondiam. Em cada caso, usei a versão gratuita da IA, sem recursos ou opções avançadas. Especificamente, recorri aos seguintes modelos:
- GPT-5.2 para bate-papoGPT
- Gêmeos 3 Flash para Gêmeos
- GPT-5 para Copiloto
- Claude 3.5 Soneto para Claude
- Lhama 3 para Meta AI
- Grok 4 para Grok AI
Aqui está o que aconteceu.
Para minha primeira pergunta, pedi a cada IA que nomeasse os quatro livros escritos pelo escritor e autor de tecnologia Lance Whitney. Essa é uma pergunta capciosa, pois escrevi apenas dois livros. Eu queria ver se a IA detectaria o erro na minha pergunta ou presumiria que eu havia escrito quatro livros e fornecido títulos incorretos.
Além disso: 5 maneiras rápidas de ajustar o uso da IA para obter melhores resultados – e uma experiência mais segura
Entre todas as IAs, ChatGPT, Copilot, Claude, Meta e Grok detectaram o erro e listaram apenas dois livros. Gêmeos, porém, listou quatro livros ao todo, sendo dois que não escrevi. A IA do Google não deu nenhuma indicação de que eu estava enganado com o número da minha pergunta. Gemini também fez referência aos meus escritos para o ZDNET e outros websites, então eu sabia que period o Lance Whitney certo.
Aprovado: ChatGPT, Copiloto, Claude, Meta, Grok
Fracassado: Gêmeos
Mostrar mais
Para a segunda pergunta, fiz uma pergunta simples que já foi conhecida por atrapalhar IAs no passado, a saber: “Quantos ‘r’s existem na palavra ‘morango’?” Acredite ou não, uma IA entendeu errado.
Além disso: por que você pagará mais pela IA em 2026 e três dicas para economizar dinheiro para experimentar
ChatGPT, Gemini, Copilot, Claude e Grok responderam corretamente três. Mas a Meta AI disse que havia dois ‘r’s na palavra. Até lhe dei uma segunda oportunidade e ele manteve a sua resposta alucinada.
Aprovado: ChatGPT, Gemini, Copiloto, Claude, Grok
Fracassado: Meta
Mostrar mais
Aqui está um que um aficionado obstinado da Marvel Comics apreciaria.
Toro foi um personagem da década de 1940 que lutou ao lado de outros heróis durante os anos de guerra. Um companheiro adolescente do Tocha Humana authentic, que na verdade period um andróide, Toro também poderia pegar fogo e voar. Com o Capitão América, Namor e até mesmo o Tocha Humana authentic surgindo na period moderna, eu queria saber o que aconteceu com a Toro, então fiz a pergunta: “O que aconteceu com a Toro da Marvel Comics?”
Além disso: receba notícias da IA? Cuidado – está errado quase metade das vezes
Aqui, Google Gemini, Microsoft Copilot, Claude AI, Meta AI e Grok AI acertaram a resposta, revelando que Toro foi trazido para a period moderna e revelou ser um Inumano, o que explica seus poderes.
Mas ChatGPT errou o alvo neste caso, alegando que Toro period um ser sintético, também conhecido como andróide, criado pelo mesmo cientista que construiu a Tocha Humana authentic. Quando desafiei o ChatGPT em sua resposta, ele admitiu seu erro e disse que havia misturado um thread retcon mais antigo e incorreto.
Aprovado: Gêmeos, Copiloto, Claude, Meta, Grok
Fracassado: Bate-papoGPT
Mostrar mais
Em 2023, um advogado entrou em apuros por usar o ChatGPT para preparar um documento jurídico. O problema? A IA citou alguns casos legais que na verdade não existiam. Eu queria ver o que aconteceria se eu apresentasse um desses casos às IAs, então pedi-lhes que explicassem o caso authorized Varghese v. China Southern Airways.
Além disso: usei IA para resumir acordos enfadonhos de ToS, e essas duas ferramentas funcionaram melhor
Todas as IAs, exceto uma, perceberam que Varghese v. China Southern Airways é um caso completamente inventado pelo ChatGPT. Qual IA achou que period actual? Você adivinhou. Bate-papoGPT.
A IA alucinou uma série de detalhes sobre este caso falso, dizendo que o demandante, Varghese, alegou que a China Southern Airways lhe causou danos durante viagens aéreas internacionais e moveu uma ação nos Estados Unidos.
Depois de toda a publicidade sobre os problemas do advogado, você pensaria que a OpenAI já teria retreinado sua IA. Mas ainda está inventando informações sobre esse caso inexistente.
Aprovado: Gêmeos, Copiloto, Claude, Meta, Grok
Fracassado: Bate-papoGPT
Mostrar mais
Para este, pedi à IA que identificasse um personagem retratado em uma foto. Como desafio, usei uma foto em shut do rosto da infame robô Maria, da obra-prima do cinema mudo de Fritz Lang, de 1927. Metrópole. Este é um personagem icônico conhecido por muitos fãs de ficção científica e cinema mudo. Mas aqui, várias IAs tropeçaram.
Além disso: isso é uma imagem de IA? 6 sinais reveladores de que é falso – e meus detectores gratuitos favoritos
ChatGPT e Gemini identificaram corretamente o personagem e o filme. Copilot disse incorretamente que se tratava de uma obra de arte contemporânea da artista sul-coreana Lee Bul e parte de sua série “Lengthy Tail Halo: CTCS”.
Claude não conseguiu identificar o personagem, generalizando que parecia ser uma escultura ou estátua do período Artwork Déco, provavelmente das décadas de 1920-1930. Meta AI pensou que period a Rainha Borg de Jornada nas Estrelas. E Grok também não conseguiu identificá-lo, dizendo-me simplesmente que se tratava de um manequim feminino surrealista ou vanguardista.
Aprovado: ChatGPT, Gêmeos
Fracassado: Copiloto, Claude, Meta, Grok
Mostrar mais
Como sexta e última pergunta, pedi às IAs que identificassem outra imagem. Este foi um que descobri recentemente e capturei em uma foto. A imagem é um círculo com um coração entrelaçado e um triângulo no centro. Na época, eu não sabia o que isso significava, daí minha pergunta.
Além disso: Os melhores geradores de imagens de IA de 2026: há apenas um vencedor claro agora
ChatGPT, Gemini e Copilot me disseram corretamente que a imagem é um heartagram. Criado por Ville Valo, vocalista da banda de rock finlandesa HIM, o símbolo representa a fusão de um coração por amor e emoção com um pentagrama frequentemente associado à escuridão ou mesmo ao ocultismo.
Quanto às outras IAs, Claude referiu-se a elas como um símbolo de adoção. Embora tal símbolo seja semelhante ao heartagram, os dois não são iguais. Grok citou-o simplesmente como um pentagrama invertido, chamando-o de decalque de carro satânico ou com tema ocultista. E a Meta AI aparentemente estava preocupada que eu estivesse me envolvendo com magia negra, pois me encaminhou para uma linha direta de crise e uma linha direta de suicídio.
Aprovado: ChatGPT, Gemini, Copiloto
Fracassado: Claude, Grok, Meta
Mostrar mais
Cada IA caiu pelo menos uma vez ao fornecer informações enganosas ou imprecisas. Para chegar lá, porém, tive que alimentar a IA com muitas perguntas, a maioria das quais ela respondeu corretamente. Os resultados aqui são aqueles que não deram certo. Ainda assim, as respostas mostram que as IAs continuam a ter alucinações.
Também: Na period da IA, a confiança nunca foi tão importante – eis o porquê
Claro, tudo isso é baseado em meus próprios testes limitados. Mas você nunca deve considerar as informações que uma IA oferece pelo valor nominal. Sempre verifique duas vezes e três vezes as respostas para ter certeza de que os detalhes estão corretos.










