No closing do ano passado, o Google conquistou brevemente a coroa de modelo de IA mais poderoso do mundo com o lançamento do Gemini 3 Professional – apenas para ser superado em semanas pela OpenAI e pela Anthropic lançando novos modelos, o que é comum na ferozmente competitiva corrida de IA.
Agora o Google está de volta para retomar o trono com um versão atualizada desse modelo principal: Gemini 3.1 Proposicionado como uma linha de base mais inteligente para tarefas onde uma resposta simples é insuficiente – visando fluxos de trabalho de ciência, pesquisa e engenharia que exigem planejamento e síntese profundos.
Já, avaliações por empresa terceirizada Artificial Analysis mostram que o Gemini 3.1 Professional do Google saltou para a frente do grupo e é mais uma vez o modelo de IA mais poderoso e de desempenho do mundo.
Um grande salto no raciocínio central
O avanço mais significativo do Gemini 3.1 Professional reside no seu desempenho em benchmarks lógicos rigorosos. Mais notavelmente, o modelo alcançou uma pontuação verificada de 77,1% no ARC-AGI-2.
Este benchmark específico foi projetado para avaliar a capacidade de um modelo de resolver padrões lógicos inteiramente novos que não encontrou durante o treinamento.
Este resultado representa mais que o dobro do desempenho de raciocínio do modelo anterior Gemini 3 Professional.
Além da lógica abstrata, os benchmarks internos indicam que o 3.1 Professional é altamente competitivo em domínios especializados:
-
Conhecimento Científico: Pontuou 94,3% no GPQA Diamond.
-
Codificação: Alcançou um Elo de 2.887 no LiveCodeBench Professional e marcou 80,6% no SWE-Bench Verified.
-
Compreensão multimodal: Alcançou 92,6% no MMMLU.
Estes ganhos técnicos não são apenas incrementais; eles representam um refinamento na forma como o modelo lida com tokens “pensantes” e tarefas de longo horizonte, fornecendo uma base mais confiável para desenvolvedores que constroem agentes autônomos.
Codificação de vibração e síntese 3D aprimoradas
O Google está demonstrando a utilidade do modelo por meio da “inteligência aplicada” – mudando o foco das interfaces de chat para resultados funcionais.
Um dos recursos mais proeminentes é a capacidade do modelo de gerar SVGs animados “codificados em vibração” diretamente a partir de prompts de texto. Como são baseados em código e não em pixels, eles permanecem escaláveis e mantêm tamanhos de arquivo minúsculos em comparação com o vídeo tradicional, apresentando recursos visuais muito mais detalhados, apresentáveis e profissionais para websites, apresentações e outros aplicativos empresariais.
Outros aplicativos apresentados incluem:
-
Síntese de Sistema Complexo: O modelo configurou com sucesso um fluxo de telemetria pública para construir um painel aeroespacial ao vivo visualizando a órbita da Estação Espacial Internacional.
-
Design Interativo: Em uma demonstração, o 3.1 Professional codificou um complexo murmúrio de estorninho em 3D que os usuários podem manipular por meio de rastreamento guide, acompanhado por uma pontuação de áudio generativa.
-
Codificação criativa: A modelo traduziu os temas atmosféricos do filme de Emily Brontë Morro dos Ventos Uivantes em um internet design funcional e moderno, demonstrando capacidade de raciocinar por meio de tom e estilo, em vez de apenas texto literal.
Impacto nos negócios e reações da comunidade
Os parceiros empresariais já começaram a integrar a versão prévia do 3.1 Professional, relatando melhorias visíveis em confiabilidade e eficiência.
Vladislav Tankov, Diretor de IA da JetBrains, observou uma melhoria de qualidade de 15% em relação às versões anteriores, afirmando que o modelo é “mais forte, mais rápido… e mais eficiente, exigindo menos tokens de saída”. Outras reações da indústria incluem:
-
Blocos de dados: O CTO Hanlin Tang relatou que o modelo alcançou “os melhores resultados da categoria” no OfficeQA, uma referência para raciocínio fundamentado em dados tabulares e não estruturados.
-
Roda: O cofundador Andrew Carr destacou a “compreensão substancialmente melhorada das transformações 3D” do modelo, observando que ele resolveu bugs de ordem de rotação de longa information em pipelines de animação 3D.
-
Horizontes da Hostinger: O chefe de produto, Dainius Kavoliunas, observou que o modelo entende a “vibração” por trás de um immediate, traduzindo a intenção em código com estilo preciso para não desenvolvedores.
Preço, licenciamento e disponibilidade
Para os desenvolvedores, o aspecto mais marcante da versão 3.1 Professional é a relação “raciocínio em relação ao dólar”. Quando o Gemini 3 Professional foi lançado, ele estava posicionado na faixa de preço médio-alto, com US$ 2,00 por milhão de tokens de entrada para prompts padrão. O Gemini 3.1 Professional mantém essa estrutura de preços exata, oferecendo efetivamente uma atualização massiva de desempenho sem custo adicional para os usuários da API.
-
Preço de entrada: US$ 2,00 por 1 milhão de tokens para solicitações de até 200 mil; US$ 4,00 por 1 milhão de tokens para solicitações acima de 200 mil.
-
Preço de saída: US$ 12,00 por 1 milhão de tokens para solicitações de até 200 mil; US$ 18,00 por 1 milhão de tokens para solicitações acima de 200 mil.
-
Cache de Contexto: Faturado entre US$ 0,20 e US$ 0,40 por 1 milhão de tokens, dependendo do tamanho do immediate, mais uma taxa de armazenamento de US$ 4,50 por 1 milhão de tokens por hora.
-
Aterramento de pesquisa: 5.000 solicitações por mês são gratuitas, seguidas de uma cobrança de US$ 14 por 1.000 consultas de pesquisa.
Para os consumidores, o modelo está sendo implementado no aplicativo Gemini e no NotebookLM com limites mais altos para assinantes do Google AI Professional e Extremely.
Implicações de licenciamento
Como um modelo proprietário oferecido através Estúdio Vertex em Google Nuvem e o API Gêmeos3.1 Professional segue um modelo comercial padrão SaaS (Software program as a Service) em vez de uma licença de código aberto.
Para usuários corporativos, isso fornece “raciocínio fundamentado” dentro do perímetro de segurança da Vertex AI, permitindo que as empresas operem com confiança com seus próprios dados.
O standing “Visualização” permite que o Google refine a segurança e o desempenho do modelo antes da disponibilidade geral, uma prática comum na implantação de IA de alto risco.
Ao duplicar o raciocínio básico e os benchmarks especializados como o ARC-AGI-2, o Google está sinalizando que a próxima fase da corrida da IA será vencida por modelos que possam pensar em um problema, e não apenas prever a próxima palavra.













