Apesar da crescente conversa sobre um futuro em que grande parte do trabalho humano será automatizado pela IA, uma das ironias deste atual growth tecnológico é o quão teimosamente dependente dos seres humanos ele permanece, especificamente o processo de formação de modelos de IA utilizando aprendizagem por reforço a partir de suggestions humano (RLHF).
Na sua forma mais simples, o RLHF é um sistema de tutoria: depois de uma IA ser treinada em dados selecionados, ela ainda comete erros ou parece robótica. Os prestadores de serviços humanos são então contratados em massa pelos laboratórios de IA para avaliar e classificar os resultados de um novo modelo enquanto ele treina, e o modelo aprende com suas classificações, ajustando seu comportamento para oferecer resultados com classificações mais altas. Este processo é ainda mais importante à medida que a IA se expande para produzir resultados multimídia como vídeo, áudio e imagens, que podem ter medidas de qualidade mais diferenciadas e subjetivas.
Historicamente, este processo de tutoria tem sido uma enorme dor de cabeça logística e um pesadelo de relações públicas para as empresas de IA, que dependem de redes fragmentadas de prestadores de serviços estrangeiros e de conjuntos de rotulagem estática em centros geográficos específicos e de baixa renda. considerado pela mídia como salário baixo – até mesmo explorador. Também é ineficiente: exige que os laboratórios de IA esperem semanas ou meses por um único lote de suggestions, atrasando o progresso do modelo.
Agora surgiu uma nova startup para tornar o processo muito mais eficiente: RapidataA plataforma efetivamente “gamifica” o RLHF, empurrando essas tarefas de revisão em todo o mundo para quase 20 milhões de usuários de aplicativos populares, incluindo Duolingo ou Sweet Crush, na forma de tarefas de revisão curtas e opcionais que eles podem optar por concluir em vez de assistir a anúncios móveis, com os dados enviados de volta para um laboratório de IA de comissionamento instantaneamente.
Conforme compartilhado com VentureBeat em um comunicado à imprensa, esta plataforma permite que os laboratórios de IA “iterem modelos quase em tempo actual”, encurtando significativamente os prazos de desenvolvimento em comparação aos métodos tradicionais.
O CEO e fundador Jason Corkill afirmou no mesmo comunicado que Rapidata torna “o julgamento humano disponível em escala world e quase em tempo actual, abrindo um futuro onde as equipes de IA podem executar ciclos de suggestions constantes e construir sistemas que evoluem a cada dia, em vez de a cada ciclo de lançamento.””
Rapidata trata o RLHF como uma infraestrutura de alta velocidade e não como um problema de trabalho guide. Hoje, a empresa nos anunciou com exclusividade na VentureBeat seu surgimento com uma rodada inicial de US$ 8,5 milhões co-liderada pela Canaan Companions e IA Ventures, com a participação da Acequia Capital e BlueYard, para dimensionar sua abordagem exclusiva para dados humanos sob demanda.
A conversa de pub que construiu uma nuvem humana
A gênese do Rapidata não nasceu em uma sala de reuniões, mas em uma mesa tomando algumas cervejas. Quando Corkill period estudante na ETH Zurique, trabalhando em robótica e visão computacional, quando se deparou com o obstáculo que todo engenheiro de IA eventualmente enfrenta: o gargalo na anotação de dados.
“Especificamente, trabalho com robótica, IA e visão computacional há alguns anos, estudei na ETH aqui em Zurique e sempre fiquei frustrado com a anotação de dados”, lembrou Corkill em uma entrevista recente. “Sempre que você precisava de humanos ou de anotação de dados humanos, period como se seu projeto fosse interrompido, porque até então, você poderia avançá-lo apenas empurrando noites mais longas. Mas quando você precisava da anotação humana em grande escala, você tinha que procurar alguém e esperar algumas semanas”.
Frustrados com este atraso, Corkill e os seus cofundadores perceberam que o modelo de trabalho existente para a IA estava fundamentalmente quebrado para um mundo que se movia à velocidade da computação moderna. Embora a computação cresça exponencialmente, a força de trabalho humana tradicional — vinculada à integração guide, à contratação regional e aos ciclos de pagamento lentos — não o faz. O Rapidata nasceu da ideia de que o julgamento humano poderia ser prestado como um serviço distribuído globalmente e quase instantâneo.
Tecnologia: Transformando pegadas digitais em dados de treinamento
A principal inovação do Rapidata reside no seu método de distribuição. Em vez de contratar anotadores em tempo integral em regiões específicas, o Rapidata aproveita a economia de atenção existente no mundo dos aplicativos móveis. Ao fazer parceria com aplicativos de terceiros, como Sweet Crush ou Duolingo, o Rapidata oferece aos usuários uma escolha: assistir a um anúncio tradicional ou passar alguns segundos fornecendo suggestions para um modelo de IA.
“Os usuários são questionados: ‘Ei, você prefere, em vez de assistir a anúncios e ter, você sabe, as empresas comprando seus olhos assim, você prefere anotar alguns dados, dar suggestions?’”, Explicou Corkill. Segundo Corkill, entre 50% e 60% dos usuários optam pela tarefa de suggestions em vez de um anúncio em vídeo tradicional.
Essa abordagem de “inteligência coletiva” permite que as equipes de IA explorem um grupo demográfico world e diversificado em uma escala sem precedentes.
-
A rede world: Atualmente, o Rapidata atinge entre 15 e 20 milhões de pessoas.
-
Paralelismo massivo: A plataforma pode processar 1,5 milhão de anotações humanas em uma única hora.
-
Velocidade: Os ciclos de suggestions que antes demoravam semanas ou meses são reduzidos a horas ou até minutos.
-
Controle de qualidade: A plataforma cria perfis de confiança e experiência para os entrevistados ao longo do tempo, garantindo que perguntas complexas sejam respondidas pelos juízes humanos mais relevantes.
-
Anonimato: Embora os usuários sejam rastreados por meio de IDs anônimos para garantir consistência e confiabilidade, o Rapidata não coleta identidades pessoais, mantendo a privacidade e otimizando a qualidade dos dados.
RLHF on-line: passando para a GPU
O salto tecnológico mais significativo que a Rapidata está possibilitando é o que Corkill descreve como “RLHF on-line”. Tradicionalmente, a IA é treinada em lotes desconectados: você treina o modelo, para, envia dados para humanos, espera semanas pelos rótulos e depois retoma. Isto cria um “círculo” de informações que muitas vezes carece de novas contribuições humanas.
Rapidata está transferindo esse julgamento diretamente para o ciclo de treinamento. Como sua rede é muito rápida, eles podem integrar by way of API diretamente com as GPUs que executam o modelo.
“Sempre tivemos essa ideia de aprendizado por reforço para suggestions humano… até agora, você sempre teve que fazer isso em lotes”, disse Corkill. “Agora, se você for até o fim, temos alguns clientes onde, por sermos muito rápidos, podemos estar diretamente, basicamente no processo, como no processador na GPU direita, e a GPU calcula alguma saída, e pode solicitar imediatamente de nós de forma distribuída. ‘Oh, eu preciso, eu preciso, preciso de um humano para olhar isso.’ Recebo a resposta e aplico essa perda, o que até agora não foi possível”.
Atualmente, a plataforma suporta cerca de 5.500 pessoas por minuto, fornecendo suggestions ao vivo para modelos executados em milhares de GPUs. Isso evita o “hackeamento do modelo de recompensa”, onde dois modelos de IA enganam um ao outro em um ciclo de suggestions, fundamentando o treinamento em nuances humanas reais.
Produto: Resolvendo o gosto e o contexto world
À medida que a IA vai além do simples reconhecimento de objetos para a mídia generativa, os requisitos para rotulagem de dados evoluíram da marcação objetiva para uma curadoria subjetiva “baseada no gosto”. Não se trata mais apenas de “isso é um gato?” mas sim “esta síntese de voz é convincente?” ou “qual destes dois resumos parece mais profissional?”.
Lily Clifford, CEO da startup de IA de voz Rime, observa que o Rapidata tem sido transformador para testar modelos em contextos do mundo actual. “Anteriormente, coletar suggestions significativo significava reunir fornecedores e pesquisas, segmento por segmento, ou país por país, o que não period escalonável”, disse Clifford. Usando o Rapidata, a Rime pode alcançar o público certo – seja na Suécia, na Sérvia ou nos Estados Unidos – e ver o desempenho dos modelos em fluxos de trabalho reais de clientes em dias, não meses.
“A maioria dos modelos está factualmente correta, mas tenho certeza de que você recebeu e-mails que parecem, você sabe, não autênticos, certo?” Corkill observou. “Você pode sentir o cheiro de um e-mail de IA, pode sentir o cheiro de uma imagem ou vídeo de IA, fica imediatamente claro para você… esses modelos ainda não parecem humanos e você precisa de suggestions humano para fazer isso”.
A mudança económica e operacional
Do ponto de vista operacional, o Rapidata se posiciona como uma camada de infraestrutura que elimina a necessidade das empresas gerenciarem suas próprias operações de anotação personalizadas. Ao fornecer uma rede escalável, a empresa está reduzindo a barreira de entrada para equipes de IA que anteriormente lutavam com o custo e a complexidade dos ciclos de suggestions tradicionais.
Jared Newman, da Canaan Companions, que liderou o investimento, sugere que esta infraestrutura é essencial para a próxima geração de IA. “Toda implantação séria de IA depende do julgamento humano em algum momento do ciclo de vida”, disse Newman. “À medida que os modelos passam de tarefas baseadas na experiência para uma curadoria baseada no gosto, a procura por suggestions humano escalável crescerá dramaticamente”.
Um futuro de uso humano
Embora o foco atual esteja nos laboratórios de modelos da Bay Space, Corkill vê um futuro onde os próprios modelos de IA se tornarão os principais clientes do julgamento humano. Ele chama isso de “uso humano”.
Nessa visão, a IA de um designer de automóveis não geraria apenas um veículo genérico; poderia programaticamente ligar para o Rapidata para perguntar a 25.000 pessoas no mercado francês o que elas acham de uma estética específica, repetir esse suggestions e refinar seu design em poucas horas.
“A sociedade está em constante mudança”, observou Corkill, abordando a tendência de utilização da IA para simular o comportamento humano. “Se simularem uma sociedade agora, a simulação ficará estável e talvez espelhará a nossa por alguns meses, mas depois muda completamente, porque a sociedade mudou e se desenvolveu de forma completamente diferente”.
Ao criar uma forma distribuída e programática de acessar a capacidade do cérebro humano em todo o mundo, o Rapidata está se posicionando como a interconexão very important entre o silício e a sociedade. Com US$ 8,5 milhões em novos financiamentos, a empresa planeja agir agressivamente para garantir que, à medida que a IA cresce, o elemento humano não seja mais um gargalo, mas um recurso em tempo actual.











