IA da Anthropic bloqueia até tarefas básicas de cibersegurança

A Anthropic lançou, na terça-feira, o Fable, descrito pela empresa como uma versão pública e limitada do Mythos, seu sistema voltado à segurança digital. O lançamento rapidamente virou alvo de reclamações entre pesquisadores e profissionais da área, que consideram os bloqueios amplos demais até para tarefas simples.

Segundo a TechCrunch, as críticas começaram a aparecer em redes sociais e fóruns especializados. Valentina “Chompie” Palmiotti, pesquisadora de segurança que trabalha na IBM X-Force, escreveu que o Fable “rejeita qualquer requisição que possa ser tangencialmente relacionada a cibersegurança. Até tarefas inócuas, como ler uma postagem de blog”. Outro pesquisador reclamou no X que “até pedir uma revisão de código” aciona as barreiras da plataforma.

Pessoa segurando celular com logomarca do Claude Mythos na tela; ao fundo, monitor exibe linhas de código de programação — *Nova IA da Anthropic interrompe conversas ao detectar temas ligados à cibersegurança ou biologia. Imagem: Photo For Everything/Shutterstock* – Imagem: Photo For Everything/Shutterstock

O que faz o Fable bloquear pedidos

Quando um prompt ativa os mecanismos internos de proteção, o Fable interrompe a conversa e exibe uma mensagem informando que suas “medidas de segurança sinalizaram esta mensagem por tópicos de cibersegurança ou biologia”. Nesses casos, a ferramenta retorna automaticamente ao Claude Opus 4.8.

A empresa afirma que os filtros existem para evitar que o sistema seja usado na criação de malware ou para invadir softwares — uma preocupação antiga da Anthropic. A companhia também bloqueia pedidos ligados à biologia por receio de uso indevido envolvendo armas biológicas.

Especialistas reclamam dos filtros

Matt Suiche, veterano da área e membro da equipe técnica da Tolmo, startup de segurança digital com IA, disse ao TechCrunch que “se você pede para ele escrever código seguro, ele assume que é trabalho relacionado a cibersegurança em vez de boas práticas de engenharia de software, e você é rebaixado”. Suiche afirmou ainda que o sistema “parece ser baseado em palavras-chave, então qualquer coisa no campo lexical de ‘cibersegurança’ aciona as restrições”.

Mesmo criticando o funcionamento do sistema, Suiche disse entender a postura da empresa. “Ainda estamos nos primeiros dias e eles ainda estão adaptando suas restrições. Tenho certeza de que vão evoluir com o tempo, à medida que a Anthropic e outras empresas de modelos de fronteira colaborarem com a nova geração de empresas de cibersegurança”, afirmou. “É melhor pegar mais pessoas do que pegar de menos quando você faz um lançamento assim, e relaxar as restrições ao longo do tempo.”

Profissionais da área reclamam que até pedidos considerados inofensivos são barrados pelo Fable. Imagem: JRdes/Shutterstock – Imagem: JRdes/Shutterstock

Como o Mythos chegou ao mercado

O Mythos foi lançado pela Anthropic em abril, inicialmente com acesso restrito a um grupo limitado de empresas e organizações dentro do Projeto Glasswing, iniciativa voltada à proteção de softwares e infraestruturas críticas. Na semana passada, a companhia ampliou o acesso ao sistema para centenas de organizações em 15 países.

Leia mais:

Além dos filtros internos, a Anthropic exige que profissionais da área se inscrevam no Cyber Verification Program. Profissionais aprovados conseguem usar o Claude com menos bloqueios para trabalhos ligados à segurança digital. A OpenAI mantém um programa semelhante chamado Trusted Access for Cyber.

As críticas continuam circulando entre profissionais da área, principalmente por causa dos bloqueios considerados exagerados. A Anthropic não respondeu ao pedido de comentário da reportagem.

O post IA da Anthropic bloqueia até tarefas básicas de cibersegurança apareceu primeiro em Olhar Digital.