Siga ZDNET: Adicione-nos como fonte preferencial no Google.
Principais conclusões da ZDNET
- As IAs receberam tarefas de trabalho já concluídas por pessoas reais.
- As IAs falharam miseravelmente em comparação com os trabalhadores humanos.
- Mas a IA está ficando mais inteligente.
Um dos muitos receios em relação à IA é que esta substitua as pessoas nos seus empregos. E embora tais receios não sejam infundados, podem ser exagerados, pelo menos por agora, de acordo com um novo estudo.
Índice de Trabalho Remoto
Para avaliar se a inteligência synthetic poderia concluir um projeto com a mesma eficácia que um ser humano, um grupo de pesquisadores deram a várias IAs uma série de projetos de trabalho para realizar. Já realizados por verdadeiros trabalhadores autônomos remotos, os projetos abrangeram desenvolvimento de jogos, design de produtos, arquitetura, análise de dados e animação de vídeo.
Mais especificamente, as tarefas incluíam desafios como os seguintes:
- Crie um painel interativo para explorar dados de o Relatório Mundial da Felicidade.
- Crie animações 3D para mostrar os recursos de um novo design e case de fones de ouvido.
- Crie um vídeo animado 2D anunciando as ofertas de uma empresa de serviços gratuitos.
- Desenvolva planos arquitetônicos e um modelo 3D para uma casa contêiner com base em um projeto PDF existente.
- Crie uma versão com tema cervejeiro do “Jogo de melancia”, onde os jogadores fundem objetos que caem para alcançar o merchandise de nível mais alto.
- Formate um artigo usando os recursos e equações fornecidos para um Conferência IEEE.
Também: Testei a Deep Analysis do ChatGPT contra Gemini, Perplexity e Grok AI para ver qual é o melhor
Abrangendo vários níveis de dificuldade, as tarefas executadas pelas pessoas reais custaram US$ 10.000 e levaram mais de 100 horas para serem concluídas. Para medir como a automação da IA se compara ao trabalho remoto realizado por seres humanos, os pesquisadores estabeleceram um benchmark chamado Índice de Trabalho Remoto (RLI).
Qual foi o desempenho dos modelos de IA
Conforme descrito pelos pesquisadores, o objetivo do RLI é testar a capacidade da IA de automatizar centenas de projetos longos, do mundo actual e economicamente valiosos a partir de plataformas de trabalho remotas.
Também: O ChatGPT Plus vale seus $ 20? Eu comparei com os planos Gratuito e Professional, e aqui está meu conselho
Os modelos de IA utilizados no estudo foram Manus, Grok 4, Sonnet 4.5, GPT-5, agente ChatGPT e Gemini 2.5 Professional.
Então, como eles se apresentaram? Não muito bem.
“Embora os sistemas de IA tenham saturado muitos benchmarks existentes, descobrimos que os agentes de IA de última geração têm um desempenho próximo ao RLI”, revelaram os pesquisadores. “O modelo de melhor desempenho atinge uma taxa de automação de apenas 2,5%. Isto demonstra que os sistemas contemporâneos de IA não conseguem concluir a grande maioria dos projetos com um nível de qualidade que seria aceito como trabalho comissionado.”
Manus teve o melhor desempenho com uma taxa de desempenho de 2,5%. Grok 4 e Sonnet 4.5 empataram com 2,1%, GPT-5 foi o próximo com 1,7%, seguido pelo agente ChatGPT com 1,3%. Gêmeos ficou em último lugar com 0,8%.
Também: A IA está vindo para o seu trabalho? Aqui está um indicador trabalhista que pode acalmar seus medos
Um dos pesquisadores, Dan Hendrycks, comentou sobre o teste e os resultados by way of uma postagem no X. Hendrycks reconheceu que, embora as IA sejam inteligentes, ainda não são tão úteis, não com uma taxa international de automação inferior a 3%.
Para explicar por que as IAs falharam no trabalho, Hendrycks disse que muitas capacidades de IA são deficientes. As IAs não aprendem no trabalho porque não possuem armazenamento de memória de longo prazo. Além disso, as habilidades visuais de uma IA são limitadas, uma habilidade necessária para executar várias tarefas.
Melhorando constantemente
Tudo isso parece uma boa notícia para os trabalhadores preocupados em serem substituídos pela IA. Certo? Bem, não rasgue seus currículos ainda. O teste incorporou especificamente tarefas criativas que exigiam habilidades um tanto avançadas. Outros tipos de empregos e projetos provavelmente seriam mais facilmente abordados por uma IA. Além disso, a IA ficará cada vez mais inteligente e capaz.
Também: Precisa de um novo emprego? Essas funções de IA são as que mais crescem nos EUA, afirma o LinkedIn
“Embora as taxas absolutas de automação sejam baixas, a nossa análise mostra que os modelos estão a melhorar constantemente e que o progresso nestas tarefas complexas é mensurável”, disseram os investigadores. “Isso fornece uma base comum para rastrear a trajetória da automação da IA, permitindo que as partes interessadas naveguem proativamente pelos seus impactos”.
Sim, é melhor manter esses currículos atualizados para garantir.













