A Anthropic lançou, na terça-feira, o Fable, descrito pela empresa como uma versão pública e limitada do Mythos, seu sistema voltado à segurança digital. O lançamento rapidamente virou alvo de reclamações entre pesquisadores e profissionais da área, que consideram os bloqueios amplos demais até para tarefas simples.
Segundo a TechCrunch, as críticas começaram a aparecer em redes sociais e fóruns especializados. Valentina “Chompie” Palmiotti, pesquisadora de segurança que trabalha na IBM X-Force, escreveu que o Fable “rejeita qualquer requisição que possa ser tangencialmente relacionada a cibersegurança. Até tarefas inócuas, como ler uma postagem de blog”. Outro pesquisador reclamou no X que “até pedir uma revisão de código” aciona as barreiras da plataforma.

O que faz o Fable bloquear pedidos
Quando um prompt ativa os mecanismos internos de proteção, o Fable interrompe a conversa e exibe uma mensagem informando que suas “medidas de segurança sinalizaram esta mensagem por tópicos de cibersegurança ou biologia”. Nesses casos, a ferramenta retorna automaticamente ao Claude Opus 4.8.
A empresa afirma que os filtros existem para evitar que o sistema seja usado na criação de malware ou para invadir softwares — uma preocupação antiga da Anthropic. A companhia também bloqueia pedidos ligados à biologia por receio de uso indevido envolvendo armas biológicas.
Especialistas reclamam dos filtros
Matt Suiche, veterano da área e membro da equipe técnica da Tolmo, startup de segurança digital com IA, disse ao TechCrunch que “se você pede para ele escrever código seguro, ele assume que é trabalho relacionado a cibersegurança em vez de boas práticas de engenharia de software, e você é rebaixado”. Suiche afirmou ainda que o sistema “parece ser baseado em palavras-chave, então qualquer coisa no campo lexical de ‘cibersegurança’ aciona as restrições”.
Mesmo criticando o funcionamento do sistema, Suiche disse entender a postura da empresa. “Ainda estamos nos primeiros dias e eles ainda estão adaptando suas restrições. Tenho certeza de que vão evoluir com o tempo, à medida que a Anthropic e outras empresas de modelos de fronteira colaborarem com a nova geração de empresas de cibersegurança”, afirmou. “É melhor pegar mais pessoas do que pegar de menos quando você faz um lançamento assim, e relaxar as restrições ao longo do tempo.”

Como o Mythos chegou ao mercado
O Mythos foi lançado pela Anthropic em abril, inicialmente com acesso restrito a um grupo limitado de empresas e organizações dentro do Projeto Glasswing, iniciativa voltada à proteção de softwares e infraestruturas críticas. Na semana passada, a companhia ampliou o acesso ao sistema para centenas de organizações em 15 países.
Leia mais:
- Claude Fable 5: nova IA da Anthropic reduz dois meses de trabalho a um dia
- Anthropic propõe pausa global no avanço da inteligência artificial
- Anthropic alerta para risco de perda de controle da IA
Além dos filtros internos, a Anthropic exige que profissionais da área se inscrevam no Cyber Verification Program. Profissionais aprovados conseguem usar o Claude com menos bloqueios para trabalhos ligados à segurança digital. A OpenAI mantém um programa semelhante chamado Trusted Access for Cyber.
As críticas continuam circulando entre profissionais da área, principalmente por causa dos bloqueios considerados exagerados. A Anthropic não respondeu ao pedido de comentário da reportagem.
O post IA da Anthropic bloqueia até tarefas básicas de cibersegurança apareceu primeiro em Olhar Digital.