
A Microsoft anunciou, na última quinta-feira (3), três novos modelos de inteligência artificial (IA) desenvolvidos internamente: o MAI-Transcribe-1, o MAI-Voice-1 e o MAI-Image-2.
- Como os brasileiros estão usando IA no trabalho, nos estudos e na vida pessoal
- 3 IAs para fazer bons vídeos depois do fim do Sora
Os três estão disponíveis na plataforma Microsoft Foundry, voltada para desenvolvedores e empresas que criam aplicações com IA dentro do Azure. Também chegam ao MAI Playground, um ambiente de testes de modelos lançado pela companhia.
O lançamento marca a primeira entrega concreta da equipe de superinteligência da Microsoft, criada em novembro de 2025 pelo CEO da divisão de IA da empresa, Mustafa Suleyman.
-
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
-
O objetivo declarado do grupo é tornar a Microsoft "autossuficiente em IA", ou seja, menos dependente de parceiros externos, como a OpenAI, na qual a empresa investiu mais de US$ 13 bilhões.
O que cada modelo faz
O MAI-Transcribe-1 converte fala em texto em 25 idiomas e, segundo a Microsoft, opera 2,5 vezes mais rápido do que a oferta Azure Fast.
Nos benchmarks internos da empresa, o modelo supera o Whisper da OpenAI nos 25 idiomas avaliados e vence o Gemini do Google em 22 deles. O preço de entrada é de US$ 0,36 por hora.
O MAI-Voice-1 gera áudio a partir de texto e consegue produzir 60 segundos de fala em um segundo. Também suporta criação de voz personalizada a partir de poucos segundos de gravação. O modelo custa US$ 22 por milhão de caracteres processados.
Já o MAI-Image-2, voltado para criação de imagens, tem o dobro da velocidade de geração da versão anterior. O preço começa em US$ 5 por milhão de tokens de entrada de texto, e US$ 33 por milhão de tokens de saída de imagem.
Parceria com OpenAI segue, mas com novas regras
A renegociação do contrato com a OpenAI, concluída em outubro de 2025, foi o que permitiu à Microsoft partir para o desenvolvimento próprio de modelos de fronteira.
Antes disso, segundo o próprio Suleyman em entrevista ao VentureBeat, a empresa estava contratualmente impedida de desenvolver inteligência artificial geral de forma independente.
O novo acordo mantém a parceria e o acesso aos modelos da OpenAI, até 2032, mas abre espaço para que a Microsoft construa sua própria stack de modelos.
Suleyman afirmou que os times por trás dos novos lançamentos são pequenos: menos de dez pessoas em cada um, incluindo o de áudio e o de imagem. A empresa não confirmou data para um modelo de linguagem próprio voltado para tarefas gerais.
Leia a matéria no Canaltech.