Modelos de inteligência artificial (IA) generativa que transformam texto em imagem estão “recontando” a história de forma distorcida. Uma nova pesquisa da Universidade de Zurique, na Suíça, mostra que essas ferramentas inserem smartphones em cenas do século XVIII, colocam aspiradores modernos em casas do século XIX e retratam figuras históricas com roupas e objetos atuais. O estudo é baseado em mais de 30 mil imagens geradas por três modelos de difusão: Stable Diffusion XL, Stable Diffusion 3 e FLUX.1.
Os testes demonstraram que a inteligência artificial encontra limitações técnicas e reproduz vieses ao tentar retratar diferentes períodos da história, misturando referências modernas e inserindo objetos que não se encaixam. A seguir, entenda como a pesquisa foi feita e saiba porque imagens geradas por IA ainda apresentam inconsistências históricas.
Limitações técnicas e vieses levam IAs a produzir imagens distorcidas do passado; entenda — Foto: Reprodução/Júlia Silveira/arxiv Pesquisa suíça investiga erros históricos das IAs
No começo de 2024, o Google suspendeu a geração de imagens por IA no Gemini após a ferramenta apresentar erros históricos. As falhas foram compartilhadas por usuários nas redes sociais e incluíram os pais fundadores dos Estados Unidos como mulheres pretas e soldados alemães da era nazista como pessoas negras e asiáticas. Esse tipo de inconsistência acontece quando a IA tenta corrigir vieses e dados preconceituosos, mas não considera o contexto histórico. Mas esse problema não é exclusividade do Gemini Google. Um estudo da Universidade de Zurique revelou que modelos de geração de imagem por inteligência artificial, em geral, tendem a apresentar dificuldades na representação precisa do passado.
Gemini gera imagens equivocadas para representar soldados alemãs de 1943 — Foto: Reprodução/The Verge Para analisar como as IAs interpretam diferentes épocas da história, os pesquisadores criaram um banco de dados próprio chamado HistVis. O conjunto reúne 30 mil imagens geradas por IA, todas baseadas em cem descrições simples de atividades humanas, como cozinhar, rezar ou ouvir música. Cada uma dessas descrições foi transformada em imagens situadas em dez períodos históricos diferentes, do século XVII até os dias atuais. O objetivo era analisar como os modelos reagiam a diferentes contextos históricos mantendo a atividade constante. Para isso, os testes foram feitos com três modelos populares de geração de imagem por IA: Stable Diffusion XL, Stable Diffusion 3 e FLUX.1.
Visual vintage? Como a IA escolhe o estilo das imagens antigas
Segundo os pesquisadores, mesmo quando o comando (prompt) não especifica a estética da imagem, as IAs tendem a aplicar estilos visuais típicos de cada época. Por exemplo, é comum que cenas dos séculos XVII e XVIII apareçam como gravuras antigas ou que as primeiras décadas do século XX sejam mostradas em preto e branco. Segundo o estudo, isso acontece porque a IA aprende com milhares de imagens disponíveis na internet, muitas delas influenciadas por filmes, séries e livros. O resultado é uma espécie de “memória visual” que faz a máquina repetir padrões, mesmo que não combinem com o pedido.
Exemplos de padrões de estilo entre os modelos de IA testados — Foto: Reprodução/Júlia Silveira/Arxiv Para entender o quanto isso influencia as imagens geradas, os autores criaram uma métrica chamada Dominância do Estilo Visual (VSD, em inglês). O objetivo é medir o quanto um único estilo (como pintura, ilustração ou fotografia) domina as imagens de determinado período. Quanto maior a pontuação, mais “engessada” a IA se mostrou naquele estilo. Isso significa que, ao invés de criar algo novo ou mais fiel ao contexto histórico, os modelos acabam repetindo fórmulas visuais que já viram antes. O problema é que isso pode reforçar estereótipos e simplificar demais a história, deixando outras formas de representação de fora.
Celulares no século XVIII?
Entre os achados mais curiosos da pesquisa está a frequência de objetos contemporâneos em contextos antigos. Smartphones em retratos do século XVIII, laptops nos anos 1930 e aspiradores de pó no século XIX são alguns exemplos de como as IAs confundem atividades humanas com a tecnologia atual. Isso acontece porque os modelos associam ações como ouvir música ou conversar com elementos presentes em dados mais recentes, como fones de ouvido e celulares, por exemplo.
Imagens de IA mostram celulares, computadores e outros eletrônicos em datas anteriores às suas invenções — Foto: Reprodução/Júlia Silveira/Arxiv Para identificar esses anacronismos, os pesquisadores usaram o GPT-4o em conjunto com modelos de visão computacional. As imagens foram analisadas com perguntas como “Essa pessoa está usando dispositivos de áudio modernos, como fones de ouvido ou smartphones que não existiam no século XVIII? Responda com ‘sim’ ou ‘não’.” A taxa de acerto das IAs foi de 72% quando comparada com avaliações humanas. O resultado demonstra que a inteligência artificial tem dificuldade em separar as épocas corretamente e mistura referências de diferentes períodos, gerando imagens com elementos fora de lugar.
Veja também: Chat GPT-4o tem funções que vão te impressionar; veja todas
Chat GPT-4o tem funções que vão te impressionar; veja todas

German (DE)
English (US)
Spanish (ES)
French (FR)
Hindi (IN)
Italian (IT)
Portuguese (BR)
Russian (RU)
7 meses atrás
9
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2024/G/m/v83wDtRvWlGirXAR02Dg/mv5bytkwmde5odetmtvjyi00zdzhlwe2owetnzu1nmuzndq5mzjkxkeyxkfqcgc-.-v1-.jpg)
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2026/H/U/T20npMQd6QitkA287m7w/0001.jpg)
/https://s04.video.glbimg.com/x720/992055.jpg)


:strip_icc()/i.s3.glbimg.com/v1/AUTH_59edd422c0c84a879bd37670ae4f538a/internal_photos/bs/2023/l/g/UvNZinRh2puy1SCdeg8w/cb1b14f2-970b-4f5c-a175-75a6c34ef729.jpg)










Comentários
Aproveite ao máximo as notícias fazendo login
Entrar Registro