Por multimodal, entenda que é um sistema que foi treinado com áudio, imagem e texto ao mesmo tempo, o que permite que ele entenda, por exemplo, problemas matemáticos que estejam em uma folha impressa anotada.

Na prática, você consegue subir um arquivo de áudio, imagem ou texto e o sistema vai entender do que se trata. A partir disso, você poderá fazer perguntas.
A demonstração chama a atenção, pois mostra como o uso da inteligência artificial poderá auxiliar no trabalho de professores da área de exatas — segmento que até então os sistemas de inteligência artificial costumavam ir mal, pois boa parte dos modelos disponíveis tinha sido treinada apenas com texto.
Outra área de influência é a programação. O Google explicou que o Gemini consegue criar códigos avançados nas linguagens Python, C++, Go e Java.
Com isso, o Google quer se diferenciar da OpenAI, que faz o ChatGPT.

German (DE)
English (US)
Spanish (ES)
French (FR)
Hindi (IN)
Italian (IT)
Portuguese (BR)
Russian (RU)
2 anos atrás
270
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2026/x/E/q5fWAwRT28LjLU5kCZIA/imagem-2026-02-26-135530014.png)
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2025/A/8/pPeAiySTOqKBQFmfNgOg/walita.jpg)
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2023/H/S/OcOXUkTNanBvG1Fit7zw/notebook-pc-homem-digitando.jpg)
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2024/E/Y/CITDxIQSiJBR2Gn7U8Qw/minecraft-realista-15-jogos-parecidos-stardew-valley-simulador-fazenda.jpg)

:strip_icc()/i.s3.glbimg.com/v1/AUTH_59edd422c0c84a879bd37670ae4f538a/internal_photos/bs/2023/l/g/UvNZinRh2puy1SCdeg8w/cb1b14f2-970b-4f5c-a175-75a6c34ef729.jpg)



:strip_icc()/i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2024/o/u/v2hqAIQhAxupABJOskKg/1-captura-de-tela-2024-07-19-185812-39009722.png)






Comentários
Aproveite ao máximo as notícias fazendo login
Entrar Registro