Início Tecnologia Por que o MongoDB acredita que uma melhor recuperação – e não...

Por que o MongoDB acredita que uma melhor recuperação – e não modelos maiores – é a chave para uma IA empresarial confiável

13
0

Os sistemas agentes e a pesquisa corporativa dependem de uma recuperação de dados forte que funcione de forma eficiente e precisa. O provedor de banco de dados MongoDB considera seu mais novo modelos de incorporação ajudar a resolver a queda na qualidade da recuperação à medida que mais sistemas de IA entram em produção.

À medida que os sistemas agentic e RAG entram em produção, a qualidade da recuperação está emergindo como um ponto de falha silencioso – que pode prejudicar a precisão, o custo e a confiança do usuário, mesmo quando os próprios modelos funcionam bem.

A empresa lançou quatro novas versões de seus modelos de incorporação e reclassificação. O Voyage 4 estará disponível em quatro modos: voyage-4 embedding, voyage-4-large, voyage-4-lite e voyage-4-nano.

O MongoDB disse que a incorporação do voyage-4 serve como modelo de uso geral; O MongoDB considera o Voyage-4-large seu modelo principal. O Voyage-4-lite concentra-se em tarefas que exigem pouca latência e custos mais baixos, e o voyage-4-nano é destinado a ambientes de desenvolvimento e teste mais locais ou para recuperação de dados no dispositivo.

Voyage-4-nano também é o primeiro modelo aberto do MongoDB. Todos os modelos estão disponíveis através de uma API e na plataforma Atlas do MongoDB.

A empresa disse que os modelos superam modelos semelhantes do Google e Cohere no benchmark RTEB. Abraçando o rosto Referência RTEB coloca o Voyage 4 como o principal modelo de incorporação.

“A incorporação de modelos é uma daquelas escolhas invisíveis que podem realmente fazer ou quebrar as experiências de IA”, disse Frank Liu, gerente de produto do MongoDB, em um briefing. “Se você errar, seus resultados de pesquisa parecerão bastante aleatórios e superficiais, mas se você acertar, seu aplicativo de repente parecerá que entende seus usuários e seus dados.”

Ele acrescentou que o objetivo dos modelos Voyage 4 é melhorar a recuperação de dados do mundo actual, que muitas vezes entra em colapso quando os pipelines agentic e RAG entram em produção.

O MongoDB também lançou um novo modelo de incorporação multimodal, voyage-multimodal-3.5, que pode lidar com documentos que incluem texto, imagens e vídeo. Este modelo vetoriza os dados e extrai significado semântico de tabelas, gráficos, figuras e slides normalmente encontrados em documentos empresariais.

Problemas de incorporação da empresa

Para as empresas, um sistema de agente é tão bom quanto a sua capacidade de recuperar de forma confiável as informações certas no momento certo. Esse requisito se torna mais difícil à medida que as cargas de trabalho são dimensionadas e as janelas de contexto se fragmentam.

Vários provedores de modelos têm como alvo essa camada de IA agente. do Google Modelo Gemini Embedding coberto as tabelas de classificação incorporadas, e Cohere lançou seu Incorporar 4 modelo multimodalque processa documentos com mais de 200 páginas. Mistral disse que seu modelo de incorporação de codificação, Incorporação Codestralsupera Cohere, Google e até mesmo o Voyage Code 3 do MongoDB. O MongoDB argumenta que o desempenho de benchmark por si só não aborda a complexidade operacional que as empresas enfrentam na produção.

O MongoDB disse que muitos clientes descobriram que suas pilhas de dados não conseguem lidar com cargas de trabalho com reconhecimento de contexto e com uso intensivo de recuperação na produção. A empresa disse que está vendo mais fragmentação, com as empresas tendo que unir diferentes soluções para conectar bancos de dados com um modelo de recuperação ou reclassificação. Para ajudar os clientes que não desejam soluções fragmentadas, a empresa oferece seus modelos por meio de uma única plataforma de dados, a Atlas.

A aposta do MongoDB é que a recuperação não pode mais ser tratada como uma coleção solta dos melhores componentes. Para que os agentes empresariais trabalhem de forma confiável em escala, a incorporação, a reclassificação e a camada de dados precisam operar como um sistema totalmente integrado, em vez de uma pilha costurada.

avots