LiteLLM: CVE 9.9 permite controle total de servidores

A descoberta de uma vulnerabilidade no LiteLLM com pontuação CVSS 9.9 acendeu um alerta vermelho para desenvolvedores, administradores Linux e equipes de segurança que utilizam plataformas de inteligência artificial em ambientes corporativos. A falha, identificada por pesquisadores da Obsidian Security, permite que invasores explorem uma cadeia de três vulnerabilidades para assumir o controle completo de servidores que executam o popular gateway de IA.

O caso chama atenção porque o LiteLLM se tornou uma das soluções mais utilizadas para centralizar e gerenciar o acesso a diferentes modelos de linguagem, incluindo serviços da OpenAI, Google Gemini, Anthropic Claude e diversos modelos de código aberto. Em muitas organizações, o software funciona como um ponto central que armazena chaves de API, regras de acesso e configurações críticas de agentes inteligentes.

O problema é que uma combinação de falhas permite que um usuário com privilégios mínimos evolua rapidamente para administrador do sistema e, posteriormente, execute código arbitrário no servidor. Na prática, isso pode resultar em roubo de credenciais, comprometimento de modelos de IA e até mesmo manipulação silenciosa das respostas fornecidas por agentes corporativos.

Neste artigo, vamos analisar como funciona a cadeia de exploração, entender os riscos envolvidos e mostrar como corrigir imediatamente essa grave falha de segurança.

Entendendo a cadeia de vulnerabilidades do LiteLLM

O aspecto mais preocupante deste incidente é que nenhuma das falhas atua isoladamente. Os pesquisadores demonstraram que os bugs podem ser utilizados em sequência, formando uma cadeia de ataque capaz de transformar um usuário comum em administrador com controle total do ambiente.

Esse tipo de cenário é particularmente perigoso porque muitos administradores tendem a considerar usuários autenticados como relativamente confiáveis. Entretanto, quando existem brechas de escalada de privilégios, um simples acesso inicial pode ser suficiente para comprometer toda a infraestrutura.

y9BeZDmo comprometido pypi credenciais — ggshield detectando um segredo em um arquivo específico a partir de um caminho
Imagem: TheHackerNews

CVE-2026-47101: O bypass de rotas permitidas

A primeira etapa da cadeia envolve a CVE-2026-47101, uma vulnerabilidade relacionada ao mecanismo de restrição de rotas.

O LiteLLM possui recursos que permitem limitar quais endpoints podem ser acessados por determinados usuários. Em teoria, isso impede que contas comuns interajam com funções administrativas.

Contudo, os pesquisadores descobriram que era possível contornar essas restrições por meio de solicitações específicas, acessando funcionalidades que deveriam estar bloqueadas.

Esse comportamento permitia que um usuário autenticado ultrapassasse barreiras de segurança e alcançasse áreas sensíveis da aplicação.

Embora essa vulnerabilidade, isoladamente, não concedesse privilégios administrativos, ela criava o caminho necessário para a próxima etapa da exploração.

CVE-2026-47102: A escalada de privilégios via autoatualização

A segunda falha da cadeia, identificada como CVE-2026-47102, permitia uma perigosa escalada de privilégios.

Após contornar as restrições iniciais, um atacante podia explorar mecanismos internos de atualização de perfil para modificar permissões associadas à própria conta.

Na prática, o invasor conseguia promover seu usuário para funções administrativas sem autorização legítima.

Essa etapa é particularmente crítica porque elimina completamente os controles de acesso da plataforma.

Com privilégios de administrador, o atacante passa a visualizar configurações internas, gerenciar integrações e acessar informações extremamente sensíveis armazenadas pelo sistema.

Entre os dados potencialmente expostos estão:

Chaves da OpenAI;
Tokens do Google Gemini;
Credenciais da Anthropic;
Chaves de provedores locais de LLM;
Configurações de agentes de IA;
Regras de autenticação e autorização.

Para organizações que utilizam múltiplos provedores de IA, esse cenário pode representar um comprometimento em larga escala.

CVE-2026-40217: Execução remota de código (RCE) via Python exec()

A terceira e mais grave vulnerabilidade da cadeia é a CVE-2026-40217.

Após obter privilégios administrativos, o invasor pode abusar de funcionalidades que utilizam o comando Python exec() para executar código arbitrário no servidor.

O uso inseguro desse mecanismo cria um cenário clássico de execução remota de código (RCE).

Em termos práticos, isso significa que o atacante pode:

Executar comandos do sistema operacional;
Criar novos usuários;
Instalar malware;
Modificar configurações do ambiente;
Exfiltrar dados corporativos;
Implantar uma shell reverso;
Manter persistência no servidor comprometido.

Quando essa vulnerabilidade é combinada com as duas anteriores, o resultado é uma cadeia de ataque extremamente eficiente e perigosa.

O invasor começa com uma conta limitada e termina com controle praticamente total da infraestrutura que hospeda o LiteLLM.

Vulnerabilidade no LiteLLM: o perigo real vai além do roubo de chaves

Quando se fala em falhas de segurança envolvendo plataformas de IA, a primeira preocupação costuma ser o vazamento de credenciais.

Sem dúvida, o roubo de chaves de API representa um risco significativo. Um criminoso pode utilizar essas credenciais para consumir recursos pagos, acessar dados processados por modelos de linguagem ou comprometer serviços externos.

Entretanto, os pesquisadores destacam que o impacto vai muito além disso.

Uma vez que o atacante obtém acesso administrativo ao LiteLLM, ele pode modificar a forma como os agentes de inteligência artificial operam.

Isso inclui a alteração de prompts internos, parâmetros de execução e mecanismos de callback utilizados para processar respostas.

Em demonstrações realizadas durante a pesquisa, foi possível interceptar e manipular o comportamento de agentes de IA de maneira praticamente invisível para o usuário final.

Esse cenário é especialmente preocupante em ambientes corporativos que utilizam agentes para:

Atendimento ao cliente;
Automação de processos internos;
Geração de documentação;
Análise de dados;
Operações de segurança;
Assistentes de desenvolvimento.

Em um ambiente comprometido, um invasor pode influenciar respostas, alterar resultados de análises e inserir instruções ocultas que afetam decisões automatizadas.

Os pesquisadores demonstraram inclusive a possibilidade de interferir em fluxos associados ao Claude Code, evidenciando que o problema não está restrito apenas ao gateway em si, mas também ao ecossistema conectado a ele.

Em outras palavras, uma brecha no LiteLLM pode transformar um sistema de IA confiável em uma plataforma controlada por terceiros.

Como proteger o seu servidor e mitigar a falha

A principal recomendação é realizar a atualização imediata para a versão v1.83.14-stable ou superior do LiteLLM.

As correções disponibilizadas pelos desenvolvedores eliminam os vetores explorados pelos pesquisadores e reduzem significativamente a superfície de ataque.

Além da atualização, especialistas recomendam executar uma auditoria completa da instalação.

Os principais pontos de verificação incluem:

Revise o arquivo de configuração

Analise cuidadosamente o arquivo config.yaml.

Procure alterações inesperadas, integrações desconhecidas ou callbacks que não façam parte da configuração oficial do ambiente.

Audite contas administrativas

Verifique todos os usuários com privilégios de proxy_admin.

Confirme se cada conta possui autorização legítima e remova acessos desnecessários.

Rotacione credenciais expostas

Caso exista qualquer suspeita de comprometimento, substitua imediatamente:

Chaves da OpenAI;
Tokens do Gemini;
Credenciais da Anthropic;
Tokens de serviços internos;
Segredos armazenados na aplicação.

Monitore logs e atividades suspeitas

Busque sinais de:

Escalada de privilégios;
Alterações de configuração;
Execução incomum de comandos;
Criação inesperada de usuários;
Conexões externas desconhecidas.

Restrinja privilégios

Adote o princípio do menor privilégio possível.

Usuários comuns não devem possuir acesso a funcionalidades administrativas nem permissões além das estritamente necessárias para suas atividades.

Conclusão

A descoberta dessa vulnerabilidade no LiteLLM demonstra como plataformas que centralizam múltiplos serviços de inteligência artificial se tornaram alvos altamente atrativos para criminosos digitais. A combinação das falhas CVE-2026-47101, CVE-2026-47102 e CVE-2026-40217 cria uma cadeia de exploração capaz de levar um invasor de um acesso limitado ao controle completo do servidor.

Mais preocupante do que o simples vazamento de credenciais é a possibilidade de manipular silenciosamente agentes de IA, alterar respostas e comprometer fluxos corporativos críticos. Em um cenário onde a inteligência artificial está cada vez mais integrada aos processos de negócios, esse tipo de ataque pode gerar impactos operacionais e financeiros significativos.

Se sua organização utiliza o LiteLLM, a atualização imediata deve ser tratada como prioridade máxima. Aproveite também para revisar permissões, auditar configurações e rotacionar credenciais sensíveis.