Google quer levar IA superavançada para mais gente com o Gemma 4

O Google anunciou o Gemma 4, nova geração da sua família de modelos de IA abertos, voltada para raciocínio avançado e uso em agentes de IA. A novidade já está disponível globalmente para desenvolvedores e pesquisadores, sob licença Apache 2.0, com uso comercial liberado e integração em produtos sem grandes restrições.

Segundo a empresa, o Gemma 4 oferece alto desempenho com menos custo, rodando tanto em hardware local quanto na nuvem. A família tem quatro versões: Effective 2B (E2B) e Effective 4B (E4B), para celulares e dispositivos edge, além dos modelos maiores 26B Mixture of Experts (MoE) e 31B Dense, para tarefas mais pesadas. No caso do 26B MoE, o foco é responder mais rápido, usando apenas 3,8 bilhões de parâmetros a cada resposta.

A nova linha é multimodal, com suporte a vídeos e imagens em toda a família, sendo útil para tarefas envolvendo OCR e leitura de gráficos. As versões menores E2B e E4B também aceitam áudio, com foco em reconhecimento e compreensão de fala. Já o limite de contexto chega a 128K nas variantes para edge e a 256K nos modelos maiores, ajudando a lidar com grandes volumes de texto, código ou documentos em um único prompt.

-
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
-

O Gemma 4 também chega com suporte a ferramentas populares do ecossistema open source, facilitando a adoção em projetos comerciais. A proposta é possibilitar que mais pessoas e empresas usem IA avançada com mais controle sobre dados e infraestrutura, sem depender totalmente de serviços fechados.

A família foi treinada em mais de 140 idiomas e tem ótimo desempenho em benchmarks públicos. O modelo 31B aparece atualmente em 3º lugar no ranking global de modelos abertos da Arena AI, enquanto o 26B ocupa a 6ª posição, chegando a superar modelos até 20 vezes maiores.

What's new in Gemma 4? — Gemma 4 é a nova geração da família de modelos de IA abertos do Google. (Imagem: Divulgação/Google)

Como usar o Gemma 4?

O Gemma 4 pode ser testado pelo Google AI Studio e pela Google AI Edge Gallery. Para desenvolvedores Android, há suporte ao Agent Mode no Android Studio, além do AICore Developer Preview e da ML Kit GenAI Prompt API, que ajudam a criar apps de produção e já preparam o terreno para compatibilidade futura com o Gemini Nano 4.

Os modelos também podem ser baixados nas plataformas Hugging Face, Kaggle e Ollama, e tem compatibilidade com as ferramentas Transformers, vLLM, llama.cpp, LM Studio e Keras.

Já para quem precisa rodar em escala, o Gemma 4 também pode ser usado no Google Cloud, com suporte via Vertex AI, GKE e Cloud Run, incluindo recursos de segurança e conformidade para aplicações corporativas.

Leia a matéria no Canaltech.