O Google anunciou ontem o Gemini 3.1 Flash-Lite, seu modelo de inteligência artificial mais rápido até agora, além de também ser o mais eficiente em termos de custo da família Gemini 3.
De acordo com a gigante de Mountain View, a novidade supera o Gemini 2.5 Flash ao mesmo tempo em que mantém níveis semelhantes de complexidade — cortesia do suporte ao dynamic thinking.
Developers can now preview Gemini 3.1 Flash-Lite, our fastest and most cost-efficient Gemini 3 series model yet.
— Google (@Google) March 3, 2026
With a 45% increase in output speed, it outperforms 2.5 Flash and features dynamic thinking levels to match task complexity.
Rolling out in preview today in… pic.twitter.com/BdJHRFx9SI
Com um aumento de 45% na velocidade de saída, supera o 2.5 Flash e apresenta níveis de processamento dinâmicos para se adequar à complexidade da tarefa.
Disponível em versão prévia hoje no @GoogleAIStudio e no Vertex AI.
Com tempos de resposta até 2,5x mais rápidos, o Gemini 3.1 Flash-Lite entrega uma velocidade de saída 45% superior, sendo ideal para desenvolvedores com grandes volumes de trabalho.
Nos benchmarks, como era de se esperar, o novo modelo não fez feio, tendo marcado 1.432 pontos no Arena.ai Leaderboard e alcançando 86,9% no GPQA Diamond e 76,8% no MMMU Pro.
Personalizável, o Gemini 3.1 Flash-Lite vem com níveis padrão de raciocínio no AI Studio e no Vertex AI, o que dá aos desenvolvedores a chance de definir a quantidade de “pensamento” que o modelo empregará em determinada tarefa.
O 3.1 Flash-Lite consegue lidar com tarefas em grande escala, como tradução de alto volume e moderação de conteúdo, onde o custo é uma prioridade. E também consegue lidar com cargas de trabalho mais complexas que exigem raciocínio mais aprofundado, como geração de interfaces de usuário e painéis, criação de simulações ou execução de instruções.
Ainda segundo o Google, o Gemini 3.1 Flash-Lite sai por US$0,25 por milhão de tokens de entrada e por US$1,50 por milhão de tokens de saída. Acessível via AI Studio e Vertex AI (em ambos os casos, como uma preview), ele também pode ser acessado por meio da API 1 oficial do Gemini.