Início Tecnologia O Gemini 3 Deep Assume atualizado do Google supera GPT-5.2 e Claude...

O Gemini 3 Deep Assume atualizado do Google supera GPT-5.2 e Claude Opus 4.6

10
0

O Google, na quinta-feira, atualiza seu modelo de inteligência synthetic (IA) Gemini 3 Deep Assume. O modelo de fronteira já period o modelo mais inteligente da empresa quando foi lançado em dezembro de 2025. Agora, com esta atualização, o Google diz que pode ajudar os cientistas a pesquisar problemas desafiadores. A gigante da tecnologia baseada em Mountain View destacou que a atualização melhora seu desempenho em todos os principais benchmarks, mas mais notavelmente, o modelo estabelece um novo recorde no ARC-AGI-2 e no Último Exame da Humanidade, superando o GPT-5.2 da OpenAI e o Claude Opus 4.6 da Antrópico.

Gemini 3 Deep Assume é atualizado

Em um postagem no bloga gigante da tecnologia disse que está lançando uma grande atualização para o Gemini 3 Deep Assume que lhe permitirá resolver desafios modernos em ciência, pesquisa e engenharia. O modelo continua disponível para assinantes do Google AI Extremely, mas agora, um seleto grupo de pesquisadores e empresas também pode acessá-lo por meio da interface de programação de aplicativos (API) da empresa.

Ao anunciar a atualização, o CEO do Google, Sundar Pichai, disse: “O Gemini 3 Deep Assume está recebendo uma atualização significativa. Refinamos o Deep Assume em estreita parceria com cientistas e pesquisadores para enfrentar desafios difíceis do mundo actual”. Elon Musk chamou o desenvolvimento de “Impressionante”, respondendo ao submit.

Com a melhoria, afirma-se que o modelo de IA obteve uma pontuação de 84,6% no benchmark ARC-AGI-2, que mede a capacidade de raciocínio dos modelos de fronteira. O Google afirmou que a pontuação também foi verificada pela ARC Prize Basis. Também estabeleceu um novo recorde ao pontuar 48,4% (sem ferramentas) no Último Exame da Humanidade, conhecido por ser o teste de referência mais difícil que existe.

Além disso, a empresa afirmou que o Gemini 3 Deep Assume também alcançou a pontuação Elo de 3.455 no Codeforces. Em cada um desses testes, diz-se que o modelo do Google supera os modelos de fronteira da OpenAI e da Anthropic.

O Google também compartilhou como alguns pesquisadores estão usando o modelo de IA em problemas científicos do mundo actual. Ele destacou que Lisa Carbone, matemática da Rutgers College, usou o Gemini 3 Deep Assume para revisar um artigo matemático altamente técnico. Ela observou que o modelo identificou com sucesso uma falha lógica sutil que anteriormente havia passado despercebida pela revisão por pares humanos.

avots

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui