Início Tecnologia Como o Kimi K2.5 da Moonshot ajuda os construtores de IA a...

Como o Kimi K2.5 da Moonshot ajuda os construtores de IA a criar enxames de agentes com mais facilidade do que nunca

12
0

A empresa chinesa Moonshot AI atualizou seu modelo Kimi K2 de código aberto, transformando-o em um modelo de codificação e visão com uma arquitetura que suporta orquestração de enxame de agentes.

O novo modelo, Moonshot Kimi K2.5, é uma boa opção para empresas que desejam agentes que possam transmitir ações automaticamente, em vez de ter uma estrutura como um tomador de decisão central.

A empresa caracterizou o Kimi K2.5 como um “modelo completo” que suporta entradas visuais e de texto, permitindo que os usuários aproveitem o modelo para projetos de codificação mais visuais.

Moonshot não divulgou publicamente a contagem de parâmetros do K2.5, mas o modelo Kimi K2 em que se baseia tinha 1 trilhão de parâmetros totais e 32 bilhões de parâmetros ativados graças à sua arquitetura mista de especialistas.

Este é o modelo de código aberto mais recente que oferece uma alternativa às opções mais fechadas do Google, OpenAI e Anthropic, e os supera em métricas importantes, incluindo fluxos de trabalho de agência, codificação e visão.

No Último Exame da Humanidade (HLE) benchmark, Kimi K2.5 pontuou 50,2% (com ferramentas), superando o GPT-5.2 (xhigh) da OpenAI e o Claude Opus 4.5. Também conseguiu 76,8% sobre Banco SWE verificadoconsolidando seu standing como um modelo de codificação de primeira linha, embora GPT-5.2 e Opus 4.5 o superem aqui em 80 e 80,9, respectivamente.

Gráfico de comparação de benchmark Kimi K2.5 Pondering. Crédito: Moonshot AI

Moonshot disse em um comunicado à imprensa que viu um aumento de 170% no número de usuários entre setembro e novembro para Kimi K2 e Kimi K2 Pondering, que foi lançado no início de novembro.

Enxame de agentes e orquestração integrada

Moonshot visa alavancar agentes autodirigidos e o paradigma de enxame de agentes incorporado ao Kimi K2.5. O enxame de agentes tem sido apontado como a próxima fronteira no desenvolvimento de IA empresarial e sistemas baseados em agentes. Ele atraiu atenção significativa nos últimos meses.

Para as empresas, isso significa que, se construírem ecossistemas de agentes com o Kimi K2.5, poderão esperar uma escalabilidade mais eficiente. Mas em vez de “aumentar” ou aumentar o tamanho dos modelos para criar agentes maiores, está apostando em criar mais agentes que possam essencialmente orquestrar-se a si próprios.

Kimi K2.5 “cria e coordena um enxame de agentes especializados trabalhando em paralelo”. A empresa comparou-o a uma colmeia onde cada agente realiza uma tarefa ao mesmo tempo que contribui para um objetivo comum. O modelo aprende a autodirigir até 100 subagentes e pode executar fluxos de trabalho paralelos de até 1.500 chamadas de ferramentas.

“Os benchmarks contam apenas metade da história. A Moonshot AI acredita que a AGI deve, em última análise, ser avaliada por sua capacidade de concluir tarefas do mundo actual com eficiência sob restrições de tempo do mundo actual. A métrica actual com a qual eles se preocupam é: quanto do seu dia a IA realmente devolveu a você? A execução em paralelo reduz substancialmente o tempo necessário para uma tarefa complexa – tarefas que agora exigiam dias de trabalho podem ser realizadas em minutos”, disse a empresa.

As empresas que consideram as suas estratégias de orquestração começaram a olhar para plataformas de agentes onde os agentes comunicam e distribuem tarefas, em vez de seguirem uma estrutura de orquestração rígida que determina quando uma acção é concluída.

Embora o Kimi K2.5 possa oferecer uma opção atraente para organizações que desejam usar essa forma de orquestração, algumas podem se sentir mais confortáveis ​​evitando a orquestração baseada em agente incorporada ao modelo e, em vez disso, usando uma plataforma diferente para diferenciar o treinamento do modelo da tarefa de agente.

Isso ocorre porque as empresas geralmente desejam mais flexibilidade nos modelos que compõem seus agentes, para que possam construir um ecossistema de agentes que utilizem LLMs que funcionem melhor para ações específicas.

Algumas plataformas de agentes, como Salesforce, AWS Bedrock e IBM, oferecem ferramentas separadas de observabilidade, gerenciamento e monitoramento que ajudam os usuários a orquestrar agentes de IA criados com diferentes modelos e permitem que trabalhem juntos.

Codificação multimodal e depuração visible

O modelo permite que os usuários codifiquem layouts visuais, incluindo interfaces de usuário e interações. Ele raciocina sobre imagens e vídeos para compreender tarefas codificadas em entradas visuais. Por exemplo, K2.5 pode reconstruir o código de um website simplesmente analisando uma gravação de vídeo do website em ação, traduzindo dicas visuais em layouts e animações interativos.

“Interfaces, layouts e interações que são difíceis de descrever com precisão na linguagem podem ser comunicados por meio de capturas de tela ou gravações de tela, que o modelo pode interpretar e transformar em websites totalmente funcionais. Isso permite uma nova classe de experiências de codificação de vibração”, disse Moonshot.

Esse recurso está integrado ao Kimi Code, uma nova ferramenta baseada em terminal que funciona com IDEs como VSCode e Cursor.

Ele suporta “depuração visible autônoma”, onde o modelo inspeciona visualmente sua própria saída – como uma página da internet renderizada – faz referência à documentação e itera no código para corrigir mudanças de format ou erros estéticos sem intervenção humana.

Ao contrário de outros modelos multimodais que podem criar e compreender imagens, o Kimi K2.5 pode construir interações front-end para websites com recursos visuais, não apenas o código por trás deles.

Preços de API

Moonshot AI definiu um preço agressivo para a API K2.5 para competir com os principais laboratórios dos EUA, oferecendo reduções significativas em comparação com seu modelo K2 Turbo anterior.

  • Entrada: 60 centavos por milhão de tokens (um 47,8% diminuir).

  • Entrada em cache: 10 centavos por milhão de tokens (um 33,3% diminuir).

  • Saída: US$ 3 por milhão de tokens (um 62,5% diminuir).

O baixo custo das entradas armazenadas em cache (tokens de US$ 0,10/M) é particularmente relevante para os recursos “Agent Swarm”, que geralmente exigem a manutenção de grandes janelas de contexto em vários subagentes e uso extensivo de ferramentas.

Licença MIT modificada

Embora Kimi K2.5 seja de código aberto, ele é lançado sob uma licença modificada do MIT que inclui uma cláusula específica voltada para usuários comerciais de “hiperescala”.

A licença concede permissões padrão para usar, copiar, modificar e vender o software program.

No entanto, estipula que se o software program ou qualquer trabalho derivado for usado para um produto ou serviço comercial que tenha mais de 100 milhões de usuários ativos mensais (MAU) ou mais de US$ 20 milhões em receita mensal, a entidade deve exibir “Kimi K2.5” de forma destacada na interface do usuário.

Esta cláusula garante que, embora o modelo permaneça gratuito e aberto para a grande maioria da comunidade de desenvolvedores e startups, os grandes gigantes da tecnologia não podem rotular a tecnologia da Moonshot sem fornecer uma atribuição visível.

Não é totalmente “código aberto”, mas é melhor que o related do Meta Termos de licenciamento do Llama por sua família de modelos de “código aberto”, que exigia que as empresas com 700 milhões ou mais de usuários mensais obtivessem uma licença empresarial especial da empresa.

O que isso significa para os construtores de IA empresariais modernos

Para os profissionais que definem a pilha moderna de IA – desde os tomadores de decisão LLM que otimizam os ciclos de implantação até os líderes de orquestração de IA que configuram agentes e processos de negócios automatizados alimentados por IA – o Kimi K2.5 representa uma mudança elementary na alavancagem.

Ao incorporar a orquestração de enxame diretamente no modelo, o Moonshot AI efetivamente entrega a esses construtores com recursos limitados uma força de trabalho sintética, permitindo que um único engenheiro direcione cem subagentes autônomos com a mesma facilidade com um único immediate.

Esta arquitetura “scale-out” aborda diretamente o dilema dos tomadores de decisão de dados de equilibrar pipelines complexos com número limitado de funcionários, enquanto a estrutura de preços reduzida transforma o processamento de dados de alto contexto de um luxo que quebra o orçamento em uma mercadoria rotineira.

Em última análise, K2.5 sugere um futuro onde a principal restrição para uma equipe de engenharia não é mais o número de mãos nos teclados, mas a capacidade de seus líderes de coreografar um enxame.

avots

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui