Mesmo o mais inteligente os modelos de inteligência synthetic são essencialmente imitadores. Eles aprendem consumindo exemplos de trabalho humano ou tentando resolver problemas que lhes foram propostos por instrutores humanos.
Mas talvez a IA possa, de facto, aprender de uma forma mais humana – descobrindo questões interessantes a colocar a si mesma e tentando encontrar a resposta certa. Um projeto de Universidade Tsinghuao Instituto de Pequim para Inteligência Artificial Geral (BIGAI) e a Universidade Estadual da Pensilvânia mostram que a IA pode aprender a raciocinar desta forma, brincando com código de computador.
Os pesquisadores desenvolveram um sistema chamado Raciocinador Zero Absoluto (AZR) que primeiro usa um grande modelo de linguagem para gerar problemas de codificação Python desafiadores, mas solucionáveis. Em seguida, ele usa o mesmo modelo para resolver esses problemas antes de verificar seu funcionamento tentando executar o código. E, finalmente, o sistema AZR utiliza sucessos e fracassos como um sinal para refinar o modelo authentic, aumentando a sua capacidade de apresentar melhores problemas e de os resolver.
A equipe descobriu que sua abordagem melhorou significativamente as habilidades de codificação e raciocínio de versões de 7 bilhões e 14 bilhões de parâmetros do modelo de linguagem de código aberto Qwen. Impressionantemente, o modelo superou até mesmo alguns modelos que receberam dados com curadoria humana.
eu falei com André Zhaoum estudante de doutorado na Universidade de Tsinghua que teve a ideia authentic do Zero Absoluto, bem como Zilong Zhengpesquisador do BIGAI que trabalhou com ele no projeto, pelo Zoom.
Zhao me disse que a abordagem se assemelha à maneira como o aprendizado humano vai além da memorização ou imitação mecânica. “No começo você imita seus pais e gosta de seus professores, mas depois basicamente tem que fazer suas próprias perguntas”, disse ele. “E eventualmente você poderá superar aqueles que lhe ensinaram na escola.”
Zhao e Zheng observaram que a ideia de aprender IA dessa forma, às vezes chamada de “jogo autônomo”, remonta a anos atrás e foi anteriormente explorada por pessoas como Jurgen Schmidhuberum conhecido pioneiro da IA, e Pierre Yves Oudeyerum cientista da computação em Inria, na França.
Um dos elementos mais interessantes do projeto, de acordo com Zheng, é a forma como as habilidades de formulação e resolução de problemas do modelo são dimensionadas. “O nível de dificuldade aumenta à medida que o modelo se torna mais poderoso”, diz ele.
Um dos principais desafios é que, por enquanto, o sistema só funciona em problemas que podem ser facilmente verificados, como aqueles que envolvem matemática ou codificação. À medida que o projeto avança, pode ser possível usá-lo em tarefas de IA de agência, como navegar na net ou realizar tarefas de escritório. Isso pode envolver fazer com que o modelo de IA tente julgar se as ações de um agente estão corretas.
Uma possibilidade fascinante de uma abordagem como o Zero Absoluto é que ela poderia, em teoria, permitir que os modelos fossem além do ensino humano. “Assim que tivermos isso, será uma forma de alcançar a superinteligência”, disse-me Zheng.
Há sinais iniciais de que a abordagem do Zero Absoluto está se popularizando em alguns grandes laboratórios de IA.
Um projeto chamado Agente0da Salesforce, Stanford e da Universidade da Carolina do Norte em Chapel Hill, envolve um agente usuário de ferramentas de software program que se aprimora por meio do jogo autônomo. Tal como acontece com o Zero Absoluto, o modelo melhora o raciocínio geral através da resolução experimental de problemas. UM artigo recente escrito por pesquisadores da Meta, da Universidade de Illinois, e da Carnegie Mellon College, apresenta um sistema que usa um tipo semelhante de auto-jogo para engenharia de software program. Os autores deste trabalho sugerem que representa “um primeiro passo em direção a paradigmas de treinamento para agentes de software program superinteligentes”.
Encontrar novas maneiras de aprender com a IA provavelmente será um grande tema na indústria de tecnologia este ano. Com as fontes convencionais de dados a tornarem-se mais escassas e mais caras, e à medida que os laboratórios procuram novas formas de tornar os modelos mais capazes, um projeto como o Absolute Zero pode levar a sistemas de IA que sejam menos imitadores e mais humanos.












