DeepSeek lança novo modelo V4, além das variantes V4 Pro e V4 Flash

DeepSeek lança novo modelo V4, além das variantes V4 Pro e V4 Flash

Na esteira de lançamentos recentes de novos modelos por empresas como OpenAI e Anthropic, a startup chinesa DeepSeek lançou ontem a mais nova atualização do seu principal modelo de inteligência artificial: o DeepSeek-V4, que é acompanhado pelas variantes V4-Pro e V4-Flash.

Considerado o modelo de código aberto no mercado, o DeepSeek V4 conta com 1,6 trilhão de parâmetros (49 bilhões ativados simultaneamente). Ele conta com um contexto ultralongo de 1 milhão de tokens — o que permite processar cerca de 750 mil palavras de uma só vez.

Posts relacionados

Na liderança em testes entre modelos de código aberto para tarefas de programação e matemática, o modelo V4-Pro fica atrás apenas do Gemini 3.1-Pro quando falamos em “conhecimento de mundo” e à frente do Sonnet 4.5 (da Anthropic) em avaliações de experiência de uso.

O V4 Pro também oferece diferentes níveis de profundidade no pensamento, como o modo “Non-think”, pensado para tarefas simples e rápidas; o “Think High”, para planejamento complexo; e o “Think Max”, projetado para resoluções avançadas de matemática e código.

O V4-Flash, por sua vez, foi criado para ser uma opção mais rápida e econômica. Com 284 bilhões de parâmetros totais (13 bilhões ativos), ele tem um nível de raciocínio que se aproxima muito da versão Pro e atua no mesmo nível de eficiência para tarefas de agentes simples.

🚀 A prévia do DeepSeek-V4 está oficialmente ativa e de código aberto! Bem-vindos à era do comprimento de contexto de 1M custo-efetivo.

🔹 DeepSeek-V4-Pro: 1,6T total / 49B params ativos. Desempenho rivalizando os principais modelos fechados do mundo.
🔹 DeepSeek-V4-Flash: 284B total / 13B params ativos. Sua escolha rápida, eficiente e econômica.

Experimente agora em http://chat.deepseek.com via Modo Expert / Modo Instantâneo. A API foi atualizada e está disponível hoje!

📄 Relatório Técnico: huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
🤗 Pesos Abertos: huggingface.co/collections/deepseek-ai/deepseek-v4

Visando custo benefício, a DeepSeek implementou uma arquitetura de atenção híbrida que permite processar 1 milhão de tokens com 27% do poder computacional e 10% da memória em comparação com a versão anterior — ou 10% e 7%, respectivamente, no modelo V4-Flash.

Construído e otimizado especificamente para fluxos de trabalho baseados em agentes e se integrando nativamente a ferramentas como Claude Code e OpenClaw, o V4 teve uma arquitetura validada para rodar não apenas em GPUs 1 da NVIDIA, mas também em chips da HUAWEI.

O DeepSeek-V4 já está disponível para usuários na web ou no aplicativo, bem como para desenvolvedores por meio de sua API 2 oficial.

Notas de rodapé

1    Graphics processing unit, ou unidade de processamento gráfico.2    Application programming interface, ou interface de programação de aplicações.