
O Google anunciou o Gemma 4, nova geração da sua família de modelos de IA abertos, voltada para raciocínio avançado e uso em agentes de IA. A novidade já está disponível globalmente para desenvolvedores e pesquisadores, sob licença Apache 2.0, com uso comercial liberado e integração em produtos sem grandes restrições.
- O que são agentes de IA e o que eles podem fazer no seu celular?
- Qual é a diferença entre IA generativa e agentes de IA?
Segundo a empresa, o Gemma 4 oferece alto desempenho com menos custo, rodando tanto em hardware local quanto na nuvem. A família tem quatro versões: Effective 2B (E2B) e Effective 4B (E4B), para celulares e dispositivos edge, além dos modelos maiores 26B Mixture of Experts (MoE) e 31B Dense, para tarefas mais pesadas. No caso do 26B MoE, o foco é responder mais rápido, usando apenas 3,8 bilhões de parâmetros a cada resposta.
A nova linha é multimodal, com suporte a vídeos e imagens em toda a família, sendo útil para tarefas envolvendo OCR e leitura de gráficos. As versões menores E2B e E4B também aceitam áudio, com foco em reconhecimento e compreensão de fala. Já o limite de contexto chega a 128K nas variantes para edge e a 256K nos modelos maiores, ajudando a lidar com grandes volumes de texto, código ou documentos em um único prompt.
-
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
-
O Gemma 4 também chega com suporte a ferramentas populares do ecossistema open source, facilitando a adoção em projetos comerciais. A proposta é possibilitar que mais pessoas e empresas usem IA avançada com mais controle sobre dados e infraestrutura, sem depender totalmente de serviços fechados.
A família foi treinada em mais de 140 idiomas e tem ótimo desempenho em benchmarks públicos. O modelo 31B aparece atualmente em 3º lugar no ranking global de modelos abertos da Arena AI, enquanto o 26B ocupa a 6ª posição, chegando a superar modelos até 20 vezes maiores.
Como usar o Gemma 4?
O Gemma 4 pode ser testado pelo Google AI Studio e pela Google AI Edge Gallery. Para desenvolvedores Android, há suporte ao Agent Mode no Android Studio, além do AICore Developer Preview e da ML Kit GenAI Prompt API, que ajudam a criar apps de produção e já preparam o terreno para compatibilidade futura com o Gemini Nano 4.
Os modelos também podem ser baixados nas plataformas Hugging Face, Kaggle e Ollama, e tem compatibilidade com as ferramentas Transformers, vLLM, llama.cpp, LM Studio e Keras.
Já para quem precisa rodar em escala, o Gemma 4 também pode ser usado no Google Cloud, com suporte via Vertex AI, GKE e Cloud Run, incluindo recursos de segurança e conformidade para aplicações corporativas.
Leia a matéria no Canaltech.