Claude já escreve 80% do código da Anthropic e assusta a empresa

Em maio de 2026, mais de 80% do código integrado à base de produção da Anthropic foi escrito pelo Claude, segundo relatório publicado pelo Anthropic Institute na última quarta-feira (4).

O número subiu de dígitos simples desde o lançamento do Claude Code, em fevereiro de 2025, e é acompanhado de um alerta da própria empresa: o ritmo de evolução pode levar a sistemas que projetam seus próprios sucessores sem controle humano adequado.

O documento, intitulado "When AI builds itself" (Quando a IA se constrói, em inglês), foi produzido por Marina Favaro e Jack Clark, do Anthropic Institute. Segundo os autores, o fenômeno descrito como "autoaperfeiçoamento recursivo" ainda não foi atingido, mas pode chegar antes do que as instituições esperam.

-
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
-

Os números por trás da mudança

A produtividade dos funcionários da Anthropic multiplicou de forma expressiva. No segundo trimestre de 2026, engenheiros entregaram oito vezes mais código por trimestre do que entre 2021 e 2025. Em uma pesquisa interna com 130 pesquisadores, a mediana das respostas apontou uma produção quatro vezes maior ao usar o modelo mais recente da empresa, o Mythos Preview, em comparação ao trabalho sem IA.

Nas tarefas de engenharia mais complexas e menos especificadas, o Claude alcançou uma taxa de sucesso de 76% em maio de 2026, aumento de 50 pontos percentuais em seis meses.

O relatório traz um exemplo prático: quando uma atualização comum travou milhares de tarefas que a IA estava executando, um engenheiro pediu ajuda ao Claude. Ele explicou o problema em poucas palavras e deu ao assistente acesso aos computadores da empresa. Em apenas duas horas, a IA encontrou uma configuração oculta que estava causando o erro, testou a falha e resolveu o problema, um trabalho que normalmente exigiria de dois a três dias de um profissional humano.

A qualidade do código também acompanhou a curva. Segundo a Anthropic, o código gerado pelo Claude era "um pouco pior" que o humano no final de 2025, está em paridade atualmente e deve superá-lo ao longo deste ano.

De codificador a pesquisador

Em um experimento de abril de 2026, nove agentes paralelos foram colocados para trabalhar em um projeto de segurança de IA de ponta a ponta, sem supervisão contínua. Ao longo de cerca de 800 horas acumuladas e aproximadamente US$ 18 mil em computação, os agentes recuperaram 97% da lacuna de desempenho na tarefa. Dois pesquisadores humanos, trabalhando por uma semana, recuperaram 23%.

Outro teste mediu se o Claude seria capaz de escolher o "próximo passo" mais adequado em sessões reais de pesquisa. Em novembro de 2025, o modelo acertou o julgamento do pesquisador humano em 51% das situações. Em abril de 2026, esse número chegou a 64%.

Por que isso preocupa a Anthropic

O ponto mais significativo do relatório não é a produtividade. É o alerta sobre para onde esse caminho pode levar.

O documento descreve três cenários possíveis. No primeiro, a tendência desacelera, mas as capacidades atuais já reformulam a economia. No segundo, o desenvolvimento de IA se torna substancialmente automatizado enquanto humanos ainda definem a direção de pesquisa, o que permitiria que empresas de 100 pessoas façam o trabalho de organizações com 100 mil. No terceiro, os modelos atingem o autoaperfeiçoamento recursivo pleno e passam a projetar seus próprios sucessores.

Sobre esse terceiro cenário, a Anthropic admite não ter "boas intuições". A preocupação central é com o desalinhamento. Falhas raras e controláveis hoje poderiam se acumular de geração em geração de modelos até que o controle se torne inviável. O relatório alerta que esse desalinhamento pode ficar "cada vez mais frequente, mas cada vez menos compreendido, até perdermos o controle".

claude — O número de usuários do Claude cresceu de forma expressiva no último ano (Imagem: Viviane França/Canaltech)

Proposta de pausa global

Para lidar com esse risco, o relatório propõe um mecanismo de pausa verificável e coordenado entre laboratórios de fronteira em diferentes países, com analogia explícita ao controle de armas nucleares.

A Anthropic é clara sobre os limites da ideia. Uma pausa unilateral apenas mudaria quem lidera a corrida. O que se propõe é um acordo no qual múltiplos laboratórios concordariam em parar sob as mesmas condições e verificariam o cumprimento uns dos outros.

O problema é que o treinamento de um modelo de IA é muito mais difícil de detectar do que testar um míssil, e o incentivo para descumprir o acordo silenciosamente é grande, especialmente em um mercado de IA para código que já movimenta dezenas de bilhões de dólares.

"Se fosse possível desacelerar o desenvolvimento dessa tecnologia para nos dar mais tempo para lidar com suas imensas implicações, acreditamos que isso provavelmente seria uma coisa boa", diz o relatório.

Vale notar que os dados apresentados são auto-reportados pela Anthropic e não foram auditados de forma independente. O relatório foi publicado dias depois de a empresa protocolar pedido de abertura de capital.

Leia a matéria no Canaltech.