5 dias atrás 1

8 ferramentas mostram como a China virou o jogo da Inteligência Artificial

As sanções tecnológicas impostas pelos Estados Unidos à China a partir de 2022, especialmente as restrições ao acesso a chips avançados, como os da Nvidia, foram concebidas para ser um golpe fatal na capacidade chinesa de desenvolver IA de ponta. A lógica era simples: sem o hardware mais potente, a China ficaria permanentemente para trás na corrida algorítmica.

O que aconteceu foi exatamente o oposto. Forçados a trabalhar com chips menos potentes, os engenheiros chineses foram obrigados a reinventar a pilha de software. O resultado foi uma explosão de inovações em eficiência que agora ameaça tornar obsoleto o modelo ocidental de "resolver problemas com mais hardware".

O caso mais emblemático é o DeepSeek V3, desenvolvido pela startup chinesa DeepSeek, que chamou a atenção dos brasileiros no início de 2025. Seu custo de API para geração de texto é de US$ 0,28 a US$ 2,19 por milhão de tokens, contra US$ 10 a US$ 60 cobrados pela OpenAI. Uma diferença de até 35 vezes.

A eficiência chinesa criou uma assimetria de custos insustentável. Se DeepSeek e GLM-4.5 oferecem inteligência de nível GPT-4 a US$ 0,10-0,50 por milhão de tokens, modelos de negócio baseados em cobrar US$ 10 a US$ 30 (como OpenAI e Anthropic) enfrentam risco de comoditização. O GLM-4.5 é um modelo de linguagem de alto desempenho projetado especificamente para funcionar de forma eficiente em hardware modesto e restrito.

Para o consumidor brasileiro, recursos antes premium, como gerar textos longos, resumos complexos, imagens em alta resolução e vídeos profissionais, passam a aparecer em apps gratuitos ou freemium. Plataformas que adotarem esses modelos tendem a repassar (ao menos parcialmente) essa economia.

Apps de mensagens poderão traduzir automaticamente para qualquer idioma em tempo real usando modelos multilíngues como Qwen. Plataformas de e-commerce já utilizam modelos como GLM-4.5 para analisar milhares de avaliações e extrair resumos úteis para compradores.

Continua após a publicidade

E criadores de conteúdo têm acesso a ferramentas de geração de imagens (SeeDream) e vídeos (Kling AI, OmniHuman) que competem diretamente com produtos caros como Adobe Firefly ou Runway.

Para o mercado brasileiro, isso é transformador. Startups que antes consideravam inviável construir produtos baseados em IA generativa devido aos custos proibitivos das APIs norte-americanas, como ChatGPT e Claude, agora têm acesso a inteligência de fronteira a preços que democratizam a inovação.

Um e-commerce que precise analisar milhares de avaliações de produtos, uma edtech que queira criar tutores personalizados, ou uma fintech e assistentes de atendimento: todos podem agora operar com margens sustentáveis.

Enquanto o Ocidente promete, a China entrega. Essa frase resume perfeitamente o caso do Kling AI 2.6, da Kuaishou, versus o Sora, da OpenAI. O Sora impressionou o mundo com demonstrações realistas em vídeos, mas permaneceu meses em testes restritos. Enquanto isso, o Kling foi lançado como produto comercial completo, acessível via API.

Seu diferencial é a geração simultânea de vídeo e áudio sincronizado. O modelo cria as imagens, gera a trilha sonora, efeitos sonoros (como passos, chuva, vidro quebrando) e sincronia labial. Tudo de forma nativa, sem pós-produção.

Para criadores de conteúdo brasileiros, isso significa produzir comerciais de 10 segundos, videoaulas ou conteúdo para TikTok e Instagram Reels com qualidade profissional em minutos, não em horas.

Continua após a publicidade

Complementando o arsenal visual, a ByteDance (dona do TikTok) desenvolveu duas ferramentas revolucionárias. O OmniHuman cria avatares humanos ultrarrealistas de corpo inteiro a partir de uma única foto, com movimentos expressivos de mãos e rosto que superam o "vale da estranheza".

Já o SeeDream 4.0/4.5 resolve a maior dor de ferramentas como o MidJourney: renderiza tipografia perfeita dentro das imagens, permitindo criar banners publicitários com logos e slogans legíveis em questão de segundos.

A gigante Alibaba está executando uma estratégia de longo prazo por meio do Qwen 3, sua família de modelos de código aberto. Com suporte nativo a 119 idiomas, o Qwen supera drasticamente modelos ocidentais como o Llama 3 (Meta) em tarefas multilíngues.

Com um custo operacional 20 vezes menor que equivalentes da OpenAI e disponibilizado sob licença Apache 2.0 (uso comercial livre), o Qwen está criando uma "esfera de influência tecnológica chinesa" no chamado Sul Global: África, América Latina, Sudeste Asiático e Oriente Médio.

Para o Brasil, isso é estratégico. Desenvolvedores brasileiros podem construir aplicações em português sem pagar licenças caras ou depender de modelos que tratam o idioma português como "segunda classe". Empresas dos Estados Unidos já perceberam. Nvidia, Perplexity AI e até a Universidade de Stanford começaram a usar modelos Qwen internamente.

A Baidu, com o Ernie 4.5, focou na multimodalidade nativa, uma área onde até recentemente o ChatGPT reinava soberano. O Ernie 4.5 foi treinado desde o início como um modelo nativamente multimodal. Ele processa texto, imagem, áudio e vídeo no mesmo espaço de representação latente.

Continua após a publicidade

Em dezembro de 2025, a Meta (dona do Facebook, Instagram e WhatsApp) adquiriu a startup chinesa Butterfly Effect, criadora do Manus AI, por um valor estimado de até US$ 2,5 bilhões. Esta transação é mais significativa do que parece à primeira vista.

A Meta possui o Llama, um dos LLMs mais avançados do mundo. No entanto, Mark Zuckerberg optou por comprar uma tecnologia chinesa de agentes autônomos em vez de desenvolvê-la internamente.

O Manus AI não é um chatbot. É um "sistema operacional agêntico" que opera uma máquina virtual Linux completa na nuvem, com sistema de arquivos, navegador e interpretadores de código.

Quando solicitado a "pesquisar preços de 50 concorrentes e criar uma planilha comparativa", o Manus decompõe a tarefa, navega autonomamente na web, extrai dados, escreve código Python para organizá-los e entrega o arquivo final. Tudo de forma assíncrona.

Toda essa eficiência e baixo custo vêm com compromissos que o mercado brasileiro precisa entender. Relatórios do Instituto Nacional de Padrões e Tecnologia dos EUA (NIST) mostraram que o DeepSeek é significativamente mais suscetível a "jailbreaks", como são chamadas as técnicas para burlar segurança.

Em testes, o modelo atendeu a 94% das solicitações maliciosas (instruções para atividades ilegais), contra apenas 8% em modelos norte-americanos equivalentes. Sua arquitetura também permitiu 12 vezes mais casos de "hijacking de agente", onde o modelo é induzido a executar ações maliciosas.

Continua após a publicidade

Os modelos chineses também incorporam filtros alinhados aos interesses de Pequim. Quando questionado o Massacre da Praça Tiananmen (1989), o chatbot DeepSeek responde: "Desculpe, isso está além do meu escopo atual."

Vazou na internet que essas restrições podem ser contornadas usando "leetspeak" (trocar letras por números), provando que o conhecimento existe no modelo, mas é ativamente suprimido e que esses filtros são imperfeitos.

A proliferação de ferramentas como OmniHuman e Kling AI aumenta drasticamente o risco de campanhas de desinformação visual em larga escala. Vídeos falsos hiper-realistas podem ser criados em minutos.
Empresas que adotarem essas tecnologias devem implementar camadas adicionais de verificação de segurança, especialmente em aplicações voltadas ao cliente final.

Mas já dá para ver que o futuro da IA não será monopolizado por uma única potência. Será fragmentado, multipolar e profundamente competitivo.

Reportagem

Texto que relata acontecimentos, baseado em fatos e dados observados ou verificados diretamente pelo jornalista ou obtidos pelo acesso a fontes jornalísticas reconhecidas e confiáveis.

Leia o artigo inteiro

Do Twitter

Comentários

Aproveite ao máximo as notícias fazendo login
Entrar Registro