Início Tecnologia A period da IA ​​de agência exige uma constituição de dados, não...

A period da IA ​​de agência exige uma constituição de dados, não melhores instruções

7
0

O consenso da indústria é que 2026 será o ano da “IA agente”. Estamos ultrapassando rapidamente os chatbots que simplesmente resumem o texto. Estamos entrando na period dos agentes autônomos que executam tarefas. Esperamos que eles reservem voos, diagnostiquem interrupções no sistema, gerenciem a infraestrutura em nuvem e personalizem os fluxos de mídia em tempo actual.

Como executivo de tecnologia que supervisiona plataformas que atendem 30 milhões de usuários simultâneos durante grandes eventos globais, como as Olimpíadas e o Tremendous Bowl, vi a realidade pouco atraente por trás do hype: os agentes são incrivelmente frágeis.

Executivos e VCs ficam obcecados com benchmarks de modelos. Eles debatem Llama 3 versus GPT-4. Eles se concentram em maximizar os tamanhos das janelas de contexto. No entanto, eles estão ignorando o verdadeiro ponto de falha. A principal razão pela qual os agentes autônomos falham na produção geralmente se deve a problemas de higiene de dados.

Na period anterior da análise “human-in-the-loop”, a qualidade dos dados period um incômodo administrável. Se um pipeline de ETL apresentar problemas, um painel poderá exibir um número de receita incorreto. Um analista humano identificaria a anomalia, sinalizaria e consertaria. O raio da explosão foi contido.

No novo mundo dos agentes autónomos, essa rede de segurança desapareceu.

Se um pipeline de dados falhar hoje, um agente não apenas reportará o número errado. É preciso o errado Ação. Ele provisiona o tipo de servidor errado. Ele recomenda um filme de terror para um usuário que assiste desenhos animados. Ele alucina uma resposta de atendimento ao cliente baseada em incorporações de vetores corrompidos.

Para executar a IA na escala da NFL ou das Olimpíadas, percebi que a limpeza de dados padrão é insuficiente. Não podemos apenas “monitorar” os dados. Devemos legislar sobre isso.

Uma solução para este problema específico poderia assumir a forma de um quadro de “qualidade dos dados – credo”. Funciona como uma ‘constituição de dados’. Ele impõe milhares de regras automatizadas antes que um único byte de dados possa tocar um modelo de IA. Embora eu tenha aplicado isso especificamente à arquitetura de streaming da NBCUniversal, a metodologia é common para qualquer empresa que queira operacionalizar agentes de IA.

Eis por que a “engenharia defensiva de dados” e o Filosofia de credo são as únicas maneiras de sobreviver à period Agentic.

A armadilha do banco de dados vetorial

O principal problema dos Agentes de IA é que eles confiam implicitamente no contexto que você lhes fornece. Se você estiver usando RAG, seu banco de dados vetorial será a memória de longo prazo do agente.

Problemas de qualidade de dados padrão são catastróficos para bancos de dados vetoriais. Nos bancos de dados SQL tradicionais, um valor nulo é apenas um valor nulo. Em um banco de dados vetorial, um valor nulo ou uma incompatibilidade de esquema pode distorcer o significado semântico de toda a incorporação.

Considere um cenário em que os metadados variam. Suponha que seu pipeline ingira metadados de vídeo, mas uma condição de corrida faz com que a tag “gênero” seja perdida. Seus metadados podem marcar um vídeo como “esportes ao vivo”, mas a incorporação foi gerada a partir de um “clipe de notícias”. Quando um agente consulta o banco de dados em busca de “destaques de landing”, ele recupera o clipe de notícias porque a pesquisa de similaridade vetorial está operando em um sinal corrompido. O agente então veicula esse clipe para milhões de usuários.

Em escala, você não pode confiar no monitoramento downstream para detectar isso. No momento em que um alarme de anomalia dispara, o agente já tomou milhares de decisões erradas. Os controles de qualidade devem se deslocar para a “esquerda” absoluta do pipeline.

A estrutura do “Credo”: 3 princípios para a sobrevivência

O Crença espera-se que a estrutura atue como um guardião. É uma arquitetura de qualidade multilocatário que fica entre fontes de ingestão e modelos de IA.

Para os líderes tecnológicos que procuram construir a sua própria “constituição”, aqui estão os três princípios inegociáveis ​​que recomendo.

1. O padrão “quarentena” é obrigatório: Em muitas organizações de dados modernas, os engenheiros preferem a abordagem “ELT”. Eles despejam dados brutos em um lago e os limpam mais tarde. Para Agentes de IA, isso é inaceitável. Você não pode deixar um agente beber de um lago poluído.

O Crença A metodologia impõe uma “fila de mensagens não entregues” estrita. Se um pacote de dados violar um contrato, ele será imediatamente colocado em quarentena. Nunca chega ao banco de dados vetorial. É muito melhor para um agente dizer “não sei” devido à falta de dados do que mentir com segurança devido a dados incorretos. Esse padrão de “disjuntor” é essencial para prevenir alucinações de alto perfil.

2. Esquema é lei: Durante anos, a indústria avançou em direção à flexibilidade “sem esquemas” para avançar rapidamente. Devemos reverter essa tendência para os principais pipelines de IA. Devemos impor digitação estrita e integridade referencial.

Na minha experiência, um sistema robusto requer escala. A implementação que supervisiono atualmente impõe mais de 1.000 regras ativas executando em fluxos em tempo actual. Eles não estão apenas verificando nulos. Eles verificam a consistência da lógica de negócios.

  • Exemplo: O “user_segment” no fluxo de eventos corresponde à taxonomia ativa no function retailer? Se não, bloqueie-o.

  • Exemplo: O carimbo de information/hora está dentro da janela de latência aceitável para inferência em tempo actual? Se não, largue-o.

3. Verificações de consistência vetorial Esta é a nova fronteira para os SREs. Devemos implementar verificações automatizadas para garantir que os pedaços de texto armazenados em um banco de dados vetorial realmente correspondam aos vetores incorporados associados a eles. Falhas “silenciosas” em uma API de modelo de incorporação geralmente deixam vetores que apontam para nada. Isso faz com que os agentes recuperem ruído puro.

A guerra cultural: engenheiros versus governança

Implementando uma estrutura como Crença não é apenas um desafio técnico. É cultural.

Os engenheiros geralmente odeiam grades de proteção. Eles veem esquemas rígidos e contratos de dados como obstáculos burocráticos que retardam a velocidade de implantação. Ao introduzir uma constituição de dados, os líderes muitas vezes enfrentam resistências. As equipes sentem que estão retornando à period da “cascata” de administração rígida de banco de dados.

Para ter sucesso, você deve inverter a estrutura de incentivos. Nós demonstramos que Crença na verdade period um acelerador. Ao garantir a pureza dos dados de entrada, eliminamos as semanas que os cientistas de dados costumavam passar depurando alucinações de modelos. Transformamos a governança de dados de uma tarefa de conformidade em uma garantia de “qualidade de serviço”.

A lição para tomadores de decisão de dados

Se você está construindo uma estratégia de IA para 2026, pare de comprar mais GPUs. Pare de se preocupar com qual modelo de base está um pouco mais acima na tabela de classificação esta semana.

Comece a auditar seus contratos de dados.

Um agente de IA é tão autônomo quanto seus dados são confiáveis. Sem uma constituição de dados rigorosa e automatizada como a Crença estrutura, seus agentes acabarão se tornando desonestos. No mundo de um SRE, um agente desonesto é muito pior do que um painel quebrado. É um assassino silencioso de confiança, receita e experiência do cliente.

Manoj Yerrasani é executivo sênior de tecnologia.

Bem-vindo à comunidade VentureBeat!

Nosso programa de visitor posts é onde especialistas técnicos compartilham insights e fornecem análises profundas, neutras e não adquiridas, sobre IA, infraestrutura de dados, segurança cibernética e outras tecnologias de ponta que moldam o futuro das empresas.

Leia mais do nosso programa de visitor submit – e confira nosso diretrizes se você estiver interessado em contribuir com um artigo de sua autoria!

avots

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui