O Google tem um mundo totalmente novo para as pessoas brincarem, mas apenas por um minuto. Esta semana, a empresa lançou o Projeto Genieque a empresa chama de “modelo de mundo de uso geral”, capaz de gerar ambientes interativos. Revelado pela primeira vez a um pequeno grupo de testadores apenas para convidados em agosto do ano passado, o modelo, conhecido como Genie 3, agora está sendo lançado para assinantes do Google AI Extremely nos EUA, para que você possa colocá-lo em mãos pelo preço baixo de US$ 250 por mês.
O fato de o Google exibir um modelo mundial é interessante por si só. Ao contrário de um grande modelo de linguagem (LLM), a tecnologia subjacente que alimenta a maioria das ferramentas de IA voltadas para o consumidor, incluindo o próprio Gemini do Google, que usa a grande quantidade de dados de treinamento que recebem para prever a próxima parte mais provável de uma sequência, os modelos mundiais são treinados na dinâmica do mundo actual, incluindo propriedades físicas e espaciais, para criar uma simulação de como os ambientes físicos operam.
Os modelos mundiais são a abordagem à IA preferida por Yann LeCun, o ex-cientista-chefe da Meta AI. LeCun acredita (provavelmente corretamente) que os LLMs nunca serão capazes de alcançar a inteligência synthetic geral, o ponto em que a IA é capaz de igualar ou exceder as capacidades humanas em todos os domínios. Em vez disso, ele acredita que os modelos mundiais podem traçar um caminho para esse objetivo remaining, e ele está recentemente ingressou em uma startup isso vai all-in nessa aposta. É uma simplificação exagerada, mas a ideia é essencialmente que os LLMs só podem reconhecer padrões, enquanto os modelos mundiais permitiriam à IA executar toneladas de simulações para compreender como o mundo funciona e extrapolar novas conclusões.
A participação do Google neste mundo certamente fornece alguma legitimidade à ideia de que os modelos mundiais oferecem algo que os LLMs não podem, e não há como negar que os vídeos de pré-visualização que surgiram dos primeiros dias do Undertaking Genie são visualmente impressionantes, embora curtos. O Google está limitando os usuários a gerar 60 segundos de seu mundo, o que a empresa também diz que “pode não parecer completamente fiel à vida ou sempre aderir fielmente às instruções ou imagens, ou à física do mundo actual” – ou seja, pode não funcionar. Atualmente, as saídas são vídeos em 720p renderizados a 24 quadros por segundo, por Ars Technicae os usuários reclamaram às vezes que é bastante lento na prática.
Obtive acesso antecipado ao Undertaking Genie em @GoogleDeepMind ✨
É diferente de qualquer modelo de mundo em tempo actual que já experimentei – você gera uma cena a partir de um texto ou uma foto e depois cria o personagem que pode explorá-la.
Testei dezenas de prompts. Aqui estão os recursos de destaque 👇 pic.twitter.com/I6CPJzPzIG
-Justine Moore (@venturetwins) 29 de janeiro de 2026
Isso é bom para algo em beta, embora fale das limitações do modelo da empresa, sugerindo que o mundo pode ser menor do que você imagina. Embora os usuários tenham exaltado o recurso como se ele estivesse prestes a tirar os desenvolvedores de videogames do mercado, provavelmente vale a pena pisar no freio nessa preocupação por enquanto.
O Undertaking Genie está sendo lançado para membros do AI Extremely nos EUA. É uma ferramenta experimental que permite criar e explorar mundos virtuais infinitos, e nunca vi nada parecido. Ainda é cedo, mas já é irreal.
Nano Banana Professional + Undertaking Genie = Meu low-poly… pic.twitter.com/mkMEw2GxxU
-Josh Woodward (@joshwoodward) 29 de janeiro de 2026
O Genie 3 do Google também adota uma abordagem diferente aos modelos mundiais do que LeCun imaginou. O modelo, disponível através do Undertaking Genie, cria essencialmente um mundo contínuo baseado em vídeo. Os usuários podem navegar nisso como um videogame, mas, em teoria, os agentes de IA também poderiam percorrer indefinidamente esses mundos para entender como as coisas funcionam. A ideia de LeCun quando ele estava na Meta period criar Joint Embedding Predictive Structure (JEPA), que incorpora um modelo do mundo exterior em um agente de IA.
Mas, novamente, o fato de o Google estar promovendo um modelo mundial diz alguma coisa. Sim, a empresa enfrentará os mesmos problemas que surgiram com o lançamento de outros modelos de geração de imagens e vídeos, como o Sora 2 da OpenAI, que foi usado para cometer todos os tipos de possíveis violações de direitos autorais. Os primeiros resultados do Undertaking Genie são replicando de forma confiável os mundos da Nintendopor exemplo, e isso provavelmente causará alguns problemas. Mas também sugere que mesmo os maiores participantes neste espaço de IA reconhecem que os LLMs podem eventualmente atingir um muro.
Caramba… Genie 3 acabou de criar este mundo de jogo 3D simulado de Breath of the Wild.
Como fiz isso + instruções no comentário. pic.twitter.com/H33an42YNd
-Min Choi (@minchoi) 29 de janeiro de 2026
Dito isto, há uma razão pela qual o Google colocou um limite rígido no Undertaking Genie por enquanto. Se você acha que custa muito treinar e operar um modelo baseado em texto, think about o que é necessário para criar uma simulação do mundo totalmente gerada. Ele precisa de toneladas de dados de alta dimensão para entender tudo, desde a aparência de um mundo até como a física funciona, e requer muito poder de processamento para funcionar. É por isso que, por enquanto, os mundos podem parecer vastos, mas na prática são mantidos bastante pequenos.












