Início Tecnologia O novo GPT-5.3-Codex da OpenAI é 25% mais rápido e vai muito...

O novo GPT-5.3-Codex da OpenAI é 25% mais rápido e vai muito além da codificação agora – o que há de novo

12
0

OpenAI/Elyse Betters Picaro/ZDNET

Siga ZDNET: Adicione-nos como fonte preferencial no Google.


Principais conclusões da ZDNET

  • GPT-5.3-Codex ajudou a depurar e implantar partes de si mesmo.
  • O Codex pode ser direcionado no meio da tarefa sem perder o contexto.
  • Os prompts “subespecificados” agora produzem resultados mais ricos e utilizáveis.

A OpenAI anunciou hoje o lançamento do GPT-5.3-Codex, que a OpenAI afirma ser o modelo de codificação agente mais capaz já lançado. Curiosamente, a Anthropic, criadora do Claude Code, também está lançando um novo modelo poderoso exatamente ao mesmo tempo. O modelo da Antrópico, Opus 4.6, é um modelo de uso mais geral, mas a Antrópico é bem conhecida por sua oferta do Código Claude.

Além disso: a Anthropic diz que seu novo Claude Opus 4.6 pode acertar os resultados do seu trabalho na primeira tentativa

Tal como acontece com o Opus 4.6 da Anthropic, a OpenAI descreve o GPT-5.3 como um “modelo de fronteira”. Este é um termo que a indústria de IA usa para descrever modelos de última geração em desempenho e capacidade. De acordo com a OpenAI, o novo Codex 5.3 roda 25% mais rápido, permitindo tarefas de execução mais longa.

O GPT-5.3-Codex da OpenAI está sendo anunciado poucos dias após o anúncio da OpenAI e o lançamento de um aplicativo para Mac dedicado ao Codex.

Observadores astutos dos modelos GPT da OpenAI notarão o número da versão 5.3 nesta versão. A versão GPT mais recente da OpenAI é GPT-5.2, não GPT-5.3. Embora nada tenha sido anunciado ou mesmo sugerido, suponho que não estamos muito longe de um lançamento geral do GPT-5.3 nos próximos dias ou semanas.

Codificando IA, codifique você mesmo

Não tenho certeza se isso é incrivelmente emocionante ou profundamente perturbador. GPT-5.3-Codex é o “primeiro modelo da OpenAI que foi elementary para sua criação”. A equipe do Codex usou o Codex para depurar seu próprio treinamento, gerenciar sua própria implantação e diagnosticar resultados de testes.

Além disso: concluí 4 anos de desenvolvimento de produto em 4 dias por US$ 200 e ainda estou surpreso

A postagem no weblog da OpenAI diz: “Com o GPT-5.3-Codex, o Codex passa de um agente que pode escrever e revisar código a um agente que pode fazer quase tudo que desenvolvedores e profissionais podem fazer em um computador”. Esperemos apenas que não decida que os humanos são supérfluos.

Mais do que apenas codificação

Reconhecendo que desenvolvedores, designers, gerentes de produto e cientistas de dados fazem muito mais em seus trabalhos do que apenas codificar, o GPT-5.3-Codex foi projetado para suportar “todo o trabalho no ciclo de vida do software program – depuração, implantação, monitoramento, gravação de PRDs, edição de cópias, pesquisa de usuários, testes, métricas e muito mais”. A empresa relata que pode ajudá-lo a construir o que você quiser, mencionando especificamente a construção de apresentações de slides e planilhas.

Também: Quer codificação de vibração native? Esta pilha de IA substitui Claude Code e Codex – e é grátis

A empresa afirma que esse modelo foi projetado para ser direcionado no meio da tarefa, com interação contínua e sem perda de contexto. O novo aplicativo Codex Mac (e, presumivelmente, um próximo aplicativo do Home windows) pode definitivamente ajudar a manter a interação com o modelo enquanto ele trabalha em projetos para você.

O período de operação também é muito maior. O Codex pode executar processos que levam mais de um dia. Como teste, a OpenAI construiu dois jogos baseados na net. Usando o recurso de “habilidade” introduzido no aplicativo para Mac, os testadores usaram uma habilidade de desenvolvimento de jogos na net para construir os dois jogos com milhões de tokens.

A postagem do weblog destacou especificamente como o GPT-5.3-Codex entende melhor a intenção. Se você estiver criando um “website do dia a dia”, a postagem do weblog informa que “Prompts simples ou subespecificados agora são padrão para websites com mais funcionalidades e padrões sensatos, proporcionando uma tela inicial mais sólida para dar vida às suas ideias”.

Além disso: o Codex da OpenAI acaba de ganhar seu próprio aplicativo para Mac – e qualquer um pode experimentá-lo gratuitamente agora

Em outras palavras, se você pedir ao Codex para “fazer algo bonito para mim”, ele o fará. Tive um sucesso significativo ao pedir ao Codex 5.2 para redesenhar algumas partes do meu plugin de segurança do WordPress para tornar as telas de administração mais atraentes e atraentes. Alguns dos recursos de design que existiam nas versões anteriores do Codex foram aprimorados nesta versão mais recente.

Outros exemplos citados pelo weblog incluem exibições dinâmicas de preços e carrosséis automatizados de depoimentos.

Benchmarks de fronteira e desempenho técnico

Um dos subtextos que captei no briefing técnico do qual participei na semana passada para o aplicativo Mac Codex foi o desejo de alguns de seus clientes por tempos de resposta mais rápidos. Eu sei que muitas vezes desativo o Codex ou o Claude Code em uma tarefa de programação e depois mudo para alguma outra atividade enquanto aguardo a conclusão do processo.

Além disso: 10 segredos do ChatGPT Codex que só aprendi depois de 60 horas de programação em pares com ele

Embora minha experiência tenha mostrado que a codificação agente acelera meu processo de desenvolvimento de meses para dias, essa espera ainda é um pouco dolorosa. Portanto, aumentar o desempenho e, portanto, a velocidade de produção dos modelos, é sempre uma vitória.

De acordo com a postagem do weblog, “GPT-5.3-Codex estabelece um novo recorde na indústria no SWE-Bench Professional e Terminal Bench”. A empresa afirma que as atribuições exigem menos tokens, aumentando a eficiência. OpenAI também afirma: “GPT-5.3-Codex estabelece um novo recorde na indústria no SWE-Bench Professional e Terminal Bench e mostra forte desempenho em OSWorld e GDPVal.” Esses são benchmarks que a empresa usa para medir codificação, operações de agente e capacidades do mundo actual.

Segurança, infraestrutura e salvaguardas

OpenAI publicou um Quadro de Preparaçãoque utiliza para medir e proteger contra danos graves causados ​​por capacidades de IA de ponta. Na postagem do weblog anunciando o GPT-5.3-Codex, a empresa afirma que este novo modelo é o primeiro que classifica como “alta capacidade” para tarefas de segurança cibernética.

Ele foi treinado para identificar vulnerabilidades de software program, com proteções e monitoramento ampliados. Ao mesmo tempo, a empresa está lançando o Trusted Entry for Cyber, um programa piloto para acelerar a pesquisa de defesa cibernética, e está doando US$ 10 milhões em concessões de crédito de API para apoiar pesquisas em segurança cibernética. Se sua organização estiver envolvida em “pesquisas de segurança de boa-fé”, você poderá solicitar créditos de API por meio do website da empresa. Programa de subsídios para segurança cibernética.

Também: O ChatGPT Plus ainda vale seus $ 20? Eu comparei com os planos Free, Go e Professional – aqui está meu conselho

Apoiando essas ações, a postagem do weblog relata: “Estamos adotando uma abordagem preventiva e implantando nossa pilha de segurança cibernética mais abrangente até o momento. Nossas mitigações incluem treinamento de segurança de uso duplo, monitoramento automatizado, acesso confiável para recursos avançados e pipelines de aplicação, incluindo inteligência de ameaças”.

Disponibilidade

GPT-5.3-Codex já está disponível com planos ChatGPT pagos no aplicativo Codex, CLI, extensão IDE e net. O acesso à API está planejado e a empresa espera entregar interações 25% mais rápidas. A promoção de uso do Codex que relatamos no início desta semana para usuários gratuitos do ChatGPT ainda permanece, mas estará limitada ao GPT-5.2-Codex por enquanto.

Também: Pare de usar ChatGPT para tudo: meus modelos de IA preferidos para pesquisa, codificação e muito mais (e que evito)

O que você acha do GPT-5.3-Codex e da direção que a OpenAI está tomando com agentes de codificação mais autônomos e de longa duração? Você já experimentou o Codex ou ferramentas semelhantes como o Claude Code em um trabalho de desenvolvimento actual? Em caso afirmativo, a velocidade ou a autonomia mudaram a forma como você trabalha? O que você acha de um modelo de IA ajudando a depurar, implantar e até mesmo participar de seu próprio desenvolvimento? As salvaguardas de cibersegurança e o posicionamento do “modelo de fronteira” tranquilizam-no ou levantam novas preocupações? Deixe-nos saber nos comentários abaixo.


Você pode acompanhar as atualizações diárias do meu projeto nas redes sociais. Certifique-se de se inscrever meu boletim informativo semanal de atualizaçãoe siga-me no Twitter/X em @DavidGewirtzno Fb em Facebook.com/DavidGewirtzno Instagram em Instagram.com/DavidGewirtzno Bluesky em @DavidGewirtz.come no YouTube em YouTube.com/DavidGewirtzTV.



avots

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui