Início Tecnologia Claude Sonnet 4.6 oferece IA de nível de fronteira para usuários de...

Claude Sonnet 4.6 oferece IA de nível de fronteira para usuários de assentos gratuitos e baratos

7
0

Antrópico / Elyse Betters Picaro / ZDNET

Siga ZDNET: Adicione-nos como fonte preferencial no Google.


Principais conclusões da ZDNET

  • Claude Sonnet 4.6 é uma grande atualização em relação ao 4.5.
  • A janela de contexto de 1 milhão de tokens (em beta) permite sessões mais longas e mais ricas.
  • Agora é o padrão para usuários gratuitos e Professional, com preços inalterados.

Apenas quatro meses após a Anthropic lançar o Claude Sonnet 4.5, e uma semana após a empresa lançar o Opus 4.6, a gigante da IA ​​​​está de volta com o Claude Sonnet 4.6, uma grande atualização em relação à versão anterior.

Além disso: a Anthropic diz que seu novo Claude Opus 4.6 pode acertar os resultados do seu trabalho na primeira tentativa

Este novo modelo Sonnet 4.6, já disponível, apresenta melhor desempenho de codificação, melhores habilidades de uso do computador, raciocínio de longo contexto atualizado, melhor planejamento de agentes e melhorias no trabalho e design de conhecimento.

Tal como acontece com o Opus 4.6, o Sonnet 4.6 agora inclui uma janela de contexto de 1 milhão de tokens (em beta). Isso permite sessões de trabalho muito mais longas e complexas sem a necessidade de reinicialização ou compactação da sessão.

Sonnet 4.6 agora é o modelo padrão para usuários de nível gratuito e Professional nas várias interfaces Claude. Os preços desses planos (bem como para o uso da API Sonnet) não aumentaram.

Fechando a lacuna com o Opus

A Anthropic oferece dois modelos de IA de marca com preços diferentes, Sonnet e Opus. Opus sempre foi o Cadillac dos modelos de IA, disponível em níveis mais altos e com preços aumentados de chamadas de API por token. O Sonnet tem sido mais um modelo básico, ainda bastante capaz, mas com uso de recursos substancialmente menor, permitindo que a Anthropic o implante para usuários gratuitos e mantenha o preço do token baixo.

De acordo com a postagem no weblog da empresa anunciando o lançamento do Sonnet 4.6, “Ele se aproxima da inteligência do nível Opus a um preço que o torna mais prático para muito mais tarefas”.

Além disso: usei Claude Code para codificar um aplicativo Mac em 8 horas, mas deu mais trabalho do que mágica

De acordo com os testes da empresa, o desempenho que antes só seria visto em um modelo da classe Opus agora está disponível para usuários do Sonnet 4.6. Este novo modelo também mostra grandes melhorias na interação com computadores desktop baseados em IA.

Existem alguns limites práticos, no entanto. A empresa afirma: “O modelo certamente ainda está atrás dos humanos mais qualificados no uso de computadores. Mas mesmo assim a taxa de progresso é notável. Isso significa que o uso do computador é muito mais útil para uma série de tarefas de trabalho e que modelos substancialmente mais capazes estão ao nosso alcance.”

Os desenvolvedores preferem, mesmo ao Opus 4.5

Nos primeiros testes com usuários, a Anthropic descobriu que os desenvolvedores preferiam o Sonnet 4.6 ao Sonnet 4.5 em cerca de 70% das vezes. A empresa afirma: “Os usuários relataram que ele lê o contexto com mais eficiência antes de modificar o código e consolidar a lógica compartilhada, em vez de duplicá-lo. Isso tornou o uso menos frustrante em sessões longas do que os modelos anteriores”.

Estou curioso sobre os 30% restantes. Você pensaria que com uma atualização completa como o Sonnet 4.5 para 4.6, quase todos os usuários prefeririam o modelo mais novo. Perguntei à Anthropic por que os 30% restantes provavelmente não eram a favor do novo lançamento. Fique atento. Se eu aprender alguma coisa, compartilho aqui.

Além disso: Claude Code ganhou surpreendentes US$ 1 bilhão em 6 meses – e meu próprio aplicativo para iPhone com código de IA mostra por quê

Ao comparar o Sonnet 4.6 com o Opus 4.5 (o modelo de fronteira mais antigo lançado em novembro), os desenvolvedores preferiram o Sonnet 4.6 em cerca de 60% das vezes.

A empresa relatou que os primeiros usuários “classificaram o Sonnet 4.6 como significativamente menos propenso a excesso de engenharia e preguiça, e significativamente melhor no seguimento de instruções. [Early users] relataram menos falsas alegações de sucesso, menos alucinações e um acompanhamento mais consistente em tarefas de várias etapas”.

Dado que a versão atual de disponibilidade geral do Opus é 4.6, este resultado não é um prenúncio de uma migração em massa do modelo Opus por usuários de nível superior. Mas o que diz é que o modelo dos “assentos baratos” melhorou o suficiente para estar à altura das tarefas anteriormente reservadas aos modelos de maior desempenho.

Velocidade, praticidade e fluxos de trabalho diários

Não vamos subestimar os benefícios do maior desempenho, mas menor uso de recursos, que o Sonnet 4.6 mostra. Ao usar os níveis gratuito e Professional, a Anthropic limitará o uso com base no uso de tokens e no uso de recursos. As melhorias do Soneto 4.6 são semelhantes a um carro que ganha mais milhas por galão ao usar uma gasolina nova, especialmente se o “pickup and go” ainda for tão bom ou melhor.

Além disso: 10 coisas que eu gostaria de saber antes de confiar em Claude Code para construir meu aplicativo para iPhone

A janela quatro vezes maior de 1 milhão de tokens também oferece um benefício prático. Ele pode conter bases de código inteiras, contratos longos ou dezenas de artigos de pesquisa. A Anthropic diz: “Mais importante ainda, o Soneto 4.6 raciocina de forma eficaz em todo esse contexto. Isso pode torná-lo muito melhor no planejamento de longo horizonte.”

Onde o Opus 4.6 ainda leva

Não desista do Opus, entretanto. O Opus 4.6 ainda é o campeão do modelo de fronteira da Anthropic.

Também: Parei de usar ChatGPT para tudo: esses modelos de IA superam em pesquisa, codificação e muito mais

A empresa afirma: “Descobrimos que o Opus 4.6 continua sendo a opção mais forte para tarefas que exigem o raciocínio mais profundo, como refatoração de base de código, coordenação de vários agentes em um fluxo de trabalho e problemas onde obtê-lo certo é primordial.”

Um padrão prático para o trabalho diário

A Anthropic está posicionando o Sonnet 4.6 como um driver prático para o dia a dia. Em muitos casos, é consideravelmente mais rápido que o Opus 4.6.

Dessa forma, existem paralelos competitivos claros entre o GPT-5.3-Codex-Spark da OpenAI e seu GPT-5.3-Codex, com Spark a versão mais rápida e menos precisa e o Codex completo o modelo de fronteira liderando o desenvolvimento. Uma grande diferença é que, embora a Anthropic diga que o Sonnet 4.6 é mais rápido, ele não está fazendo nada parecido com a afirmação de desempenho de 15x que a OpenAI fez de seu modelo Spark.

Também: Por quais ferramentas de IA realmente vale a pena pagar? Vou manter essas assinaturas em 2026 – aqui está o porquê

(Divulgação: Ziff Davis, empresa controladora da ZDNET, entrou com uma ação judicial em abril de 2025 contra a OpenAI, alegando que ela violou os direitos autorais de Ziff Davis no treinamento e operação de seus sistemas de IA.)

Para a maior parte do trabalho de codificação e conhecimento, o Sonnet 4.6 oferece forte desempenho, especialmente para aqueles nos níveis de preços mais baixos. Ele também oferece um perfil sólido de preço/desempenho para usuários que trabalham com chamadas de API e desejam obter o máximo retorno possível. Entretanto, o Opus 4.6 continua a ser um caminho de escalada viável para problemas mais complexos que necessitam de um raciocínio mais profundo.

E você? Você já experimentou Claude Sonnet 4.6? Em caso afirmativo, como ele se compara ao Opus em seus fluxos de trabalho do mundo actual? A janela de contexto de 1 milhão de tokens muda a forma como você aborda a codificação, a pesquisa ou as longas sessões de planejamento?

Você se sente confortável em confiar no modelo de “assentos baratos” para trabalhos sérios ou ainda recorre ao Opus para tarefas de alto risco? E se você estiver no nível gratuito ou Professional, essas melhorias aumentam a probabilidade de você continuar com o Sonnet como seu driver diário? Deixe-nos saber nos comentários abaixo.


Você pode acompanhar as atualizações diárias do meu projeto nas redes sociais. Certifique-se de se inscrever meu boletim informativo semanal de atualizaçãoe siga-me no Twitter/X em @DavidGewirtzno Fb em Facebook.com/DavidGewirtzno Instagram em Instagram.com/DavidGewirtzno Bluesky em @DavidGewirtz.come no YouTube em YouTube.com/DavidGewirtzTV.



avots

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui