IA concorrente do Gemini derruba preço dos planos de assinatura em 75%

A DeepSeek anunciou no último sábado (23) que o corte de 75% nos custos de uso da API do seu modelo V4-Pro será permanente. O que começou como uma promoção com prazo de encerramento em 31 de maio foi convertido em redução definitiva, fixando o preço em um quarto do valor original.

Com o ajuste, os custos de acesso ao V4-Pro pela API passam a variar entre 0,025 e 6 yuans por milhão de tokens — equivalente a US$ 0,003625 a US$ 0,87 — conforme o tipo de uso. Antes, a faixa era de 0,1 a 24 yuans, ou aproximadamente US$ 0,0145 a US$ 3,48 por milhão de tokens.

Para quem acessa o modelo via API diretamente, a economia é direta e imediata.

-
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
-

O V4-Pro é o modelo mais avançado da geração V4 da empresa, lançado há cerca de um mês. A linha inclui também o V4-Flash, voltado para tarefas menos exigentes e com custo mais baixo.

Assim como os modelos anteriores da DeepSeek, o V4 é open source, e desenvolvedores podem baixar o código, executá-lo localmente e modificá-lo.

Chips da Huawei no centro da mudança

A DeepSeek não divulgou oficialmente o que viabilizou o corte. Mas a startup já havia sinalizado o caminho. Quando lançou o V4-Pro, explicou que o preço elevado se devia a "restrições em capacidade de computação de alto nível" e que os valores caíram quando os servidores de alta performance Ascend 950 da Huawei chegassem ao mercado em maior volume, previsto para o segundo semestre de 2026.

Os chips Ascend ganharam relevância para empresas chinesas de IA após as restrições de exportação dos Estados Unidos impedirem a Nvidia de comercializar seus semicondutores mais avançados na China.

A Huawei, por sua vez, ainda enfrenta gargalos de produção por conta de limitações no acesso a equipamentos de fabricação de chips.

Pressão sobre OpenAI, Anthropic e Google

O movimento da DeepSeek aumenta a pressão sobre os principais fornecedores ocidentais de modelos de IA. Segundo Neil Shah, vice-presidente da Counterpoint Research, ao portal Info World, o V4-Pro fechou a lacuna de desempenho em tarefas de raciocínio complexo e matemática em relação a modelos como o Gemini, o GPT e o Claude.

Ainda assim, a startup chinesa fica atrás em adoção global, suporte e integrações nativas com plataformas como AWS, Microsoft Azure e Google Cloud.

Shah avalia que a precificação por consumo de tokens dos grandes laboratórios ocidentais "está se tornando difícil de justificar para muitas cargas de trabalho corporativas" diante de uma alternativa aberta com preço muito menor. A tendência, na sua avaliação, é uma migração gradual desses fornecedores para modelos de cobrança baseados em resultado ou valor entregue.

Especialistas ouvidos pelo InfoWorld também apontam riscos para empresas que optarem pela API externa da DeepSeek: dados enviados para servidores hospedados na China podem estar sujeitos a legislações diferentes, o que levanta questões de soberania de dados, conformidade regulatória e potencial exposição de informações sensíveis.

Leia a matéria no Canaltech.