PEQUIM (Reuters) - A desenvolvedora chinesa de inteligência artificial DeepSeek lançou seu modelo "experimental" mais recente, que, segundo ela, é mais eficiente para treinar e melhor no processamento de longas sequências de texto do que as versões anteriores.
A empresa sediada em Hangzhou chamou o DeepSeek-V3.2-Exp de "etapa intermediária em direção à nossa arquitetura de próxima geração" em uma publicação no fórum de desenvolvedores Hugging Face. Essa arquitetura provavelmente será o lançamento de produto mais importante da DeepSeek desde que as versões V3 e R1 chocaram o Vale do Silício e investidores de tecnologia.
O modelo V3.2-Exp inclui um mecanismo chamado DeepSeek Sparse Attention, que, segundo a empresa chinesa, pode reduzir os custos de computação e aumentar o desempenho de alguns tipos de modelos. A DeepSeek disse nesta segunda-feira na rede social X que está cortando os preços da API em "mais de 50%".

German (DE)
English (US)
Spanish (ES)
French (FR)
Hindi (IN)
Italian (IT)
Portuguese (BR)
Russian (RU)
3 semanas atrás
14
:strip_icc()/i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2025/K/2/02gtJkTpyBSPTGgMWoAw/design-sem-nome.png)
:strip_icc()/i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2025/p/3/lQ4O3gTYidtQ7BShlbFQ/img-4307.png)
:strip_icc()/i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2025/H/t/vYxt6mSCSABfou2GcgMQ/00.jpg)
:strip_icc()/i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2024/h/v/OOnxRRRN6pmKn7EghvJg/techtudo-128-m.jpg)

:strip_icc()/i.s3.glbimg.com/v1/AUTH_59edd422c0c84a879bd37670ae4f538a/internal_photos/bs/2023/l/g/UvNZinRh2puy1SCdeg8w/cb1b14f2-970b-4f5c-a175-75a6c34ef729.jpg)










Comentários
Aproveite ao máximo as notícias fazendo login
Entrar Registro