Pesquisadores da Columbia Engineering treinaram um robô semelhante a um humano chamado Emo para sincronizar falas e músicas com os lábios, estudando vídeos on-line, mostrando como as máquinas agora podem aprender comportamentos humanos complexos simplesmente observando-os.
Emo não é um corpo humanóide completo, mas um rosto robótico altamente realista construído para explorar como os humanos se comunicam. O rosto é coberto por uma pele de silicone e acionado por 26 motores faciais controlados independentemente que movem os lábios, a mandíbula e as bochechas.
Esses motores permitem que o Emo forme formatos de boca detalhados que cobrem 24 consoantes e 16 vogais, o que é basic para a fala e o canto naturais. O objetivo period reduzir o efeito do vale misterioso, onde os robôs parecem quase humanos, mas ainda assim se sentem perturbadores porque seus movimentos faciais não correspondem à sua voz.
Como Emo aprendeu a sincronizar os lábios como um humano
O processo de aprendizagem aconteceu em etapas. Primeiro, Emo explorou seu próprio rosto movendo seus motores enquanto se observava no espelho. Isso ajudou o sistema a entender como os comandos motores alteram as formas faciais.
Os pesquisadores então introduziram um canal de aprendizagem que conecta o som ao movimento. Emo assistiu horas de vídeos no YouTube de pessoas falando e cantando, enquanto um modelo de IA analisava a relação entre o áudio e o movimento visível dos lábios.
Em vez de focar na linguagem ou no significado, o sistema estudou os sons brutos da fala. Um transformador de ação facial converteu esses padrões aprendidos em comandos motores em tempo actual.
Essa abordagem permitiu que o Emo sincronizasse os lábios não apenas em inglês, mas também em idiomas nos quais nunca foi treinado, incluindo francês, árabe e chinês. O mesmo método funcionou para cantar, que é mais difícil por causa das vogais alongadas e mudanças de ritmo.
Os pesquisadores dizem que isso é importante porque os futuros robôs precisarão se comunicar naturalmente se quiserem trabalhar ao lado de pessoas. Este avanço chegou quando o interesse em robôs para residências e locais de trabalho está aumentando rapidamente.
Na CES 2026, esse impulso estava em plena exibição, com demonstrações que vão desde o humanóide Atlas da Boston Dynamics, que está pronto para entrar no native de trabalho, até o robô doméstico da SwitchBot, que pode cozinhar refeições e lavar sua roupa, e o próximo robô assistente doméstico da LG, projetado para tornar a vida cotidiana mais fácil.
Adicione avanços como pele synthetic que dá aos robôs uma sensibilidade semelhante à humana e, combinada com sincronização labial realista, é fácil ver como os robôs estão começando a se sentir menos como máquinas e mais como companheiros sociais. Emo ainda é um projeto de pesquisa, mas mostra como os robôs poderão um dia aprender habilidades humanas da mesma forma que nós, observando e ouvindo.












