O Google lançou hoje o Gemini 3.1 Flash Live, que passa a ser o modelo de voz de mais alta qualidade já lançado pela empresa, projetado para permitir processamento e resposta na velocidade que se espera de uma conversa normal com humanos.
De acordo com a companhia, o modelo é extremamente rápido para reconhecer nuances como tom e ritmo de voz de forma eficaz, sendo capaz até mesmo de ajustar dinamicamente suas respostas em casos de frustração ou confusão.
Posts relacionados
- Google estaria em via de lançar app do Gemini dedicado para o macOS
- Google Maps ganha Navegação Imersiva e recursos com a IA do Gemini
- Gemini 3.1 Flash-Lite é apresentado como o modelo de IA mais rápido do Google
O modelo também melhorou sua capacidade de distinguir a fala humana de sons ambientes e evoluiu na capacidade de seguir instruções complexas e permanecer dentro de suas diretrizes, mesmo após a conversa seguir rumos inesperados.
Já disponível para desenvolvedores, usuários corporativos e o público em geral, o modelo conta com a SynthID, uma marca d’água imperceptível que permite detectar com facilidade se o conteúdo foi gerado por inteligência artificial.
Expansão do Search Live
O Gemini 3.1 Flash Live suporta nativamente mais de 90 idiomas durante conversas multimodais em tempo real e, devido a essa capacidade multilíngue, o Google anunciou uma expansão do Search Live para mais de 200 regiões.
O recurso, vale recordar, permite que o usuário apenas aponte a câmera do seu celular para o que estiver à sua frente e converse com o buscador do Google em tempo real, usando o contexto visual para oferecer assistência contínua.
Para usar o Search Live, basta abrir o app do Google e clicar no ícone “Live”, logo abaixo da barra de pesquisa, e fazer uma pergunta em voz alta para receber uma resposta em áudio com facilidade — ou, como supracitado, usar a câmera para pesquisar.