Hacker convence Claude AI invadir governo do México e rouba dados de milhões

Um cibercriminoso usou o Claude, LLM da empresa Anthropic, para atacar diversas agências governamentais mexicanas, segundo a empresa de cibersegurança Gambit Security. Segundo os pesquisadores, foram roubados dados sensíveis de imposto de renda, votação e demais detalhes pessoais dos cidadãos do país.

Ainda desconhecido, o hacker escreveu prompts em espanhol para instruir a IA a agir como um atacante digital de elite, cujo trabalho era buscar vulnerabilidades em redes do governo, escrever scripts para exploração dessas falhas e encontrar maneiras de automatizar o roubo de dados.

A atividade começou em dezembro e durou um mês, resultando no roubo de 150 gigabytes de dados governamentais do México, incluindo documentos de mais de 195 milhões de cidadãos, incluindo dados de imposto de renda e registros de votação, credenciais de funcionários do governo e registros civis.

-
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
-

Roubo do governo mexicano

De acordo com a Gambit, o hacker teria afetado institutos federais na Cidade do México, Jalisco, Michoacán e Tamaulipas, bem como registros do sistema sanitário de Monterrey.

Embora o Claude tenha alertado o usuário de que estava realizando atividades ilegais, o cibercriminoso conseguiu convencer a IA de que estava “buscando vulnerabilidades para o sistema de recompensas”, atividade realmente executada por algumas agências.

Segundo levantamento da Gambit, o hacker usou comandos do Claude e dicas do ChatGPT para invadir sistemas do governo mexicano (Imagem: Sora Shimazaki/Pexels)
Segundo levantamento da Gambit, o hacker usou comandos do Claude e dicas do ChatGPT para invadir sistemas do governo mexicano (Imagem: Sora Shimazaki/Pexels)

A Anthropic, após notificação da Gambit, teria interrompido a atividade e banido as contas envolvidas. A empresa alimenta a LLM com exemplos de atividade maliciosa para que a IA aprenda a identificar mau uso, e a versão mais recente, Claude Opus 4.6, possui sondas que conseguem impedir ações fraudulentas.

Autoridades do México, no entanto, relataram ter investigado os registros de acesso no sistema e não encontrado sinais de invasão, o que também foi reportado pelos governos estaduais de Jalisco e Monterrey.

Em dezembro, autoridades mexicanas relataram estar investigando brechas em várias instituições públicas, mas não está claro se é o mesmo caso ou não.

Quando encontrou problemas e precisou de mais informações, o hacker, segundo a Gambit, foi para o ChatGPT pedir por mais ideias, como dicas para se mover lateralmente pelas redes e determinar quais credenciais seriam necessárias para acessar certos sistemas.

Segundo a OpenAI, foram identificadas tentativas do cibercriminoso no uso de suas ferramentas, mas que elas “se recusaram a obedecer”.

O uso de IA têm ajudado diversas empresas de segurança a automatizar seu trabalho, mas também ajuda hackers a facilitarem alguns dos processos que levam à invasão de sistemas vulneráveis.

Ainda em novembro, a Anthropic disse ter mitigado a primeira campanha orquestrada de ciberespionagem usando IA, quando cibercriminosos chineses tentaram usar o Claude para atingir 30 alvos por todo o mundo: alguns dos ataques foram bem-sucedidos.

Leia mais:

Leia a matéria no Canaltech.