Apesar de todos os avanços das ferramentas de inteligência artificial (IA), a tecnologia ainda tem limitações quando se trata de tarefas complexas e criativas. Um estudo recente do Center for AI Safety e da Scale submeteu modelos avançados de IA a projetos reais de trabalho remoto, os mesmos já executados por freelancers humanos. Foram analisadas as ferramentas Manus AI, Grok 4 , Sonnet 4.5 , GPT-5 , ChatGPT agent e Gemini 2.5 Pro. Em mais de 97% dos casos, os sistemas não conseguiram entregar trabalhos com qualidade suficiente para serem aceitos como serviços profissionais.
As tarefas envolviam áreas como desenvolvimento de jogos, design de produtos, arquitetura, análise de dados e animação de vídeo. As demandas exigiam mais do que conhecimento técnico, pedindo tomada de decisão, adaptação e criatividade. Ao comparar humanos e máquinas, o estudo ajuda a dimensionar até onde a IA realmente vai e onde as pessoas ainda são indispensáveis no mundo do trabalho. Confira.
Estudo revela que ferramentas de IA não conseguem concluir a grande maioria dos projetos criativos encomendados a profissionais freelancers — Foto: Sandra Mastrogiacomo/TechTudo Diferentemente de avaliações comuns, que medem raciocínio lógico ou acerto em perguntas fechadas, o estudo apostou em projetos completos e abertos. Os modelos receberam briefings idênticos aos usados em plataformas de trabalho remoto, com prazos e critérios de qualidade semelhantes aos exigidos por clientes reais. A ideia era observar se a IA conseguiria conduzir todo o fluxo de trabalho, do início ao fim, sem intervenção humana significativa.
Exemplos de briefings apresentados aos modelos de IA — Foto: Reprodução/Center for AI Safety e Scale Para tentar responder a essa questão, os pesquisadores criaram o Índice de Trabalho Remoto (RLI, na sigla em inglês). O indicador reúne projetos reais de trabalho remoto, com valor concreto, usados para medir como sistemas de IA se saem em tarefas práticas do dia a dia profissional. O resultado mostrou que, mesmo entre as IAs mais avançadas, o desempenho ficou muito baixo: a melhor taxa de automação registrada foi a do Manus, com apenas 2,5%.
Os projetos tinham diferentes níveis de complexidade e incluíam tarefas como visualização de dados, animações em 2D ou 3D para apresentar produtos e demandas de arquitetura. O custo total chegava a mais de US$ 10.000, com tempos de conclusão superiores a 100 horas. O diferencial dos testes foi a exigência de uma entrega profissional e não apenas medir o acerto de respostas. E foi justamente aí que a maioria das IAs falhou.
Mesmo os modelos mais avançados tiveram taxas de automação muito baixas: nenhuma acima de 2,5%. Na prática, isso significa que quase todos os projetos exigiriam correções ou teriam que ser refeitos por humanos. Segundo os pesquisadores, as falhas não se limitam a erros pontuais, mas envolvem dificuldades estruturais, como entender ambiguidades do briefing, manter consistência ao longo de tarefas e adaptar decisões conforme surgem novos problemas. Além disso, diferentemente dos humanos, que se ajustam a partir de feedbacks e erros anteriores, a IA não apresenta aprendizado contínuo durante o desenvolvimento dos projetos. O estudo também mostrou que a automação das IAs falha quando os modelos são confrontados com demandas abertas e reais, que exigem adaptação e tomada de decisão ao longo do processo.
Tabela mostra taxa de sucesso dos diferentes modelos de IA na automação dos projetos — Foto: Reprodução/Center for AI Safety e Scale Os resultados vão na contramão das previsões mais alarmistas de que a IA vai substituir os profissionais criativos em breve. De acordo com o experimento, pelo menos por enquanto, os sistemas funcionam melhor como ferramentas de apoio do que como agentes autônomos, capazes de assumir projetos inteiros. A IA já muda processos e acelera etapas, mas ainda está longe de replicar sozinha o trabalho completo. No entanto, isso não significa que o avanço da tecnologia vá estagnar. Os próprios autores destacam melhora gradual no desempenho dos modelos ao longo do tempo.
Veja também: ORKUT VAI VOLTAR???? Perguntamos para o criador da rede social!
ORKUT VAI VOLTAR???? Perguntamos para o criador da rede social!

German (DE)
English (US)
Spanish (ES)
French (FR)
Hindi (IN)
Italian (IT)
Portuguese (BR)
Russian (RU)
2 horas atrás
2
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2025/b/i/VCF1cNTzG8qWUsNmwwBQ/marca-dagua-2-11-.jpg)
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2026/2/J/uLJj7IQgSVpIJTeln1pw/como-usar-os-servicos-no-app-will-bank.jpg)
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2026/c/H/M1t8JQRU23AJUm5saLmg/multiproce.png)
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2025/D/s/D7VPKASLCyBLAPvE88WA/fogao-star-clean-itatiaia.jpg)

:strip_icc()/i.s3.glbimg.com/v1/AUTH_59edd422c0c84a879bd37670ae4f538a/internal_photos/bs/2023/l/g/UvNZinRh2puy1SCdeg8w/cb1b14f2-970b-4f5c-a175-75a6c34ef729.jpg)










Comentários
Aproveite ao máximo as notícias fazendo login
Entrar Registro