A construção de sistemas de geração aumentada de recuperação (RAG) para agentes de IA geralmente envolve o uso de múltiplas camadas e tecnologias para dados estruturados, vetores e informações gráficas. Nos últimos meses, também se tornou cada vez mais claro que os sistemas de IA de agentes precisam de memória, por vezes referida como memória contextual, para funcionarem de forma eficaz.
A complexidade e a sincronização de ter diferentes camadas de dados para permitir o contexto podem levar a problemas de desempenho e precisão. É um desafio que o SurrealDB procura resolver.
SurrealDB lançou na terça-feira a versão 3.0 de seu banco de dados homônimo junto com uma extensão da Série A de US$ 23 milhões, elevando o financiamento whole para US$ 44 milhões. A empresa adotou uma abordagem arquitetural diferente de bancos de dados relacionais como PostgreSQL, bancos de dados vetoriais nativos como Pinecone ou um banco de dados gráfico como Neo4j. A equipe de engenharia da OpenAI detalhou recentemente como escalou o Postgres para 800 milhões de usuários usando réplicas de leitura – uma abordagem que funciona para cargas de trabalho com uso intenso de leitura. SurrealDB adota uma abordagem diferente: armazena memória do agente, lógica de negócios e dados multimodais diretamente no banco de dados. Em vez de sincronizar vários sistemas, a pesquisa vetorial, a travessia de gráficos e as consultas relacionais são executadas transacionalmente em um único mecanismo nativo do Rust que mantém a consistência.
“As pessoas estão executando DuckDB, Postgres, Snowflake, Neo4j, Quadrant ou Pinecone todos juntos e então se perguntam por que não conseguem obter boa precisão em seus agentes”, disse o CEO e cofundador Tobie Morgan Hitchcock ao VentureBeat. “É porque eles têm que enviar cinco consultas diferentes para cinco bancos de dados diferentes que possuem apenas o conhecimento ou o contexto com o qual lidam”.
A arquitetura repercutiu entre os desenvolvedores, com 2,3 milhões de downloads e 31.000 estrelas do GitHub até o momento para o banco de dados. As implantações existentes abrangem dispositivos de ponta em carros e sistemas de defesa, mecanismos de recomendação de produtos para os principais varejistas de Nova York e tecnologias de veiculação de anúncios Android, de acordo com Hitchcock.
Memória Agentic AI incorporada ao banco de dados
O SurrealDB armazena a memória do agente como relacionamentos gráficos e metadados semânticos diretamente no banco de dados, não no código do aplicativo ou em camadas de cache externas.
O sistema de plugins Surrealism no SurrealDB 3.0 permite que os desenvolvedores definam como os agentes constroem e consultam essa memória; a lógica é executada dentro do banco de dados com garantias transacionais, e não no middleware.
Aqui está o que isso significa na prática: quando um agente interage com os dados, ele cria gráficos de contexto que vinculam entidades, decisões e conhecimento de domínio como registros de banco de dados. Esses relacionamentos podem ser consultados por meio da mesma interface SurrealQL usada para pesquisa vetorial e dados estruturados. Um agente perguntando sobre um problema do cliente pode percorrer conexões gráficas com incidentes passados relacionados, obter incorporações vetoriais de casos semelhantes e juntar dados estruturados do cliente – tudo em uma consulta transacional.
“As pessoas não querem mais armazenar apenas os dados mais recentes”, disse Hitchcock. “Eles querem armazenar todos esses dados. Eles querem analisar e fazer com que a IA entenda e analise todos os dados de uma organização nos últimos dois anos, porque isso informa seu modelo, seu agente de IA sobre o contexto, sobre a história, e isso pode, portanto, fornecer melhores resultados.”
Como a arquitetura do SurrealDB difere das pilhas RAG tradicionais
Os sistemas RAG tradicionais consultam bancos de dados com base em tipos de dados. Os desenvolvedores escrevem consultas separadas para pesquisa de similaridade vetorial, travessia de gráficos e junções relacionais e, em seguida, mesclam os resultados no código do aplicativo. Isso cria atrasos na sincronização à medida que as consultas passam de ida e volta entre sistemas.
Em contraste, Hitchcock explicou que o SurrealDB armazena dados como documentos codificados em binário com relacionamentos gráficos incorporados diretamente ao lado deles. Uma única consulta por meio do SurrealQL pode percorrer relacionamentos de gráficos, realizar pesquisas de similaridade vetorial e unir registros estruturados sem sair do banco de dados.
Essa arquitetura também afeta o modo como a consistência funciona em escala: cada nó mantém a consistência transacional, mesmo em escala de mais de 50 nós, disse Hitchcock. Quando um agente grava um novo contexto no nó A, uma consulta no nó B vê imediatamente essa atualização. Sem cache, sem réplicas de leitura.
“Muitos dos nossos casos de uso, muitas das nossas implantações ocorrem onde os dados são constantemente atualizados e os relacionamentos, o contexto, a compreensão semântica ou as conexões gráficas entre esses dados precisam ser constantemente atualizados”, disse ele. “Portanto, não há cache. Não há réplicas de leitura. No SurrealDB, tudo é transacional.”
O que isso significa para a TI corporativa
“É importante dizer que o SurrealDB não é o melhor banco de dados para todas as tarefas. Adoraria dizer que somos, mas não é. E você não pode ser”, disse Hitchcock. “Se você só precisa de análise de petabytes de dados e nunca realmente atualiza esses dados, então será melhor usar o armazenamento de objetos ou um banco de dados colunar. Se você está lidando apenas com pesquisa vetorial, então você pode ir com um banco de dados vetorial como Quadrant ou Pinecone, e isso será suficiente.
O ponto de inflexão ocorre quando você precisa de vários tipos de dados juntos. O benefício prático aparece nos cronogramas de desenvolvimento. O que costumava levar meses para ser construído com orquestração de vários bancos de dados agora pode ser lançado em dias, disse Hitchcock.











