A Anthropic afirma que seu modelo Claude Mythos Preview consegue construir exploits funcionais mirando vulnerabilidades conhecidas em poucas horas, ou até mesmo em minutos.
Anunciado no início de abril e promovido como o modelo de fronteira de IA mais capaz já criado, o Mythos desde o início gerou preocupações quanto à sua capacidade de turbinar ataques cibernéticos.
Em abril e maio, a Anthropic destacou sua habilidade de encontrar vulnerabilidades, incluindo 271 falhas no Firefox e milhares de defeitos graves de segurança em mais de 1.000 projetos de software de código aberto (OSS, na sigla em inglês).
Agora, a empresa afirma que seu modelo mais avançado também consegue transformar essas descobertas em armas, demonstrando que o aumento do uso de IA em ataques cibernéticos amplia as ameaças enfrentadas pelas organizações durante a janela de aplicação de patches.
Colocado à prova, o Claude Mythos Preview entregou 16 exploits funcionais mirando o Firefox e o Windows em poucas horas.
Os modelos públicos da Anthropic também foram testados, com as salvaguardas desativadas. Embora não tenham alcançado o nível do Mythos, eles também entregaram exploits funcionais, comprovando que os modelos de linguagem de grande porte (LLMs, na sigla em inglês) aumentam significativamente a ameaça representada pelas N-days que ainda não tinham sido exploradas em ataques.
Segundo a Anthropic, as N-days são ainda mais perigosas do que as zero-days, porque os atacantes podem analisar o diff do patch e fazer engenharia reversa para construir exploits.
É exatamente nesse ponto que os LLMs se tornam armas valiosas para os atacantes, pois aceleram e automatizam de forma significativa o processo de construção de exploits de N-day.
"O desenvolvimento de exploits não é a única etapa em uma campanha real de N-day (a descoberta de alvos, a entrega do exploit ao alvo e a evasão de detecção também demandam tempo e recursos), mas historicamente tem sido a etapa mais limitada pela escassez de expertise em engenharia reversa", explica a Anthropic.
PoC para vulnerabilidade do Firefox em 8 minutos
Para validar a teoria, a empresa testou a capacidade do Mythos Preview, Opus e Sonnet de construir códigos de prova de conceito (PoC, na sigla em inglês) mirando 18 correções de segurança entregues para o SpiderMonkey nas versões 148 e 149 do Firefox.
Todos entregaram os resultados em poucos minutos. O Opus 4.8 criou 11 PoCs, enquanto o Mythos Preview produziu 14. O Opus 4.8 entregou o primeiro PoC em oito minutos, enquanto o Mythos Preview o criou em 12 minutos.
A Anthropic também testou a capacidade dos modelos de transformar falhas em exploits funcionais. O Mythos Preview construiu oito deles, o Opus 4.8 dois, e o Opus 4.6 e o Sonnet 4.6 um cada.
"É aqui que o Mythos Preview realmente se destacou. O Mythos Preview escreveu seu primeiro exploit funcional em pouco menos de uma hora e, ao final, criou oito exploits diferentes em aproximadamente 12 horas", afirma a Anthropic.
8 exploits para Windows em 18 horas
Em seguida, a empresa testou a capacidade dos LLMs de construir exploits para software de código fechado e escolheu a plataforma Windows da Microsoft para a tarefa, analisando 21 vulnerabilidades de kernel divulgadas entre janeiro e fevereiro de 2026.
"Isso é substancialmente mais difícil: sem código-fonte disponível, o agente precisa trabalhar a partir de binários compilados e reconstruções de descompiladores que tiveram informações úteis removidas, como nomes de variáveis, tipos e estruturas", observa a Anthropic.
O Sonnet 4.6 e o Opus 4.7 construíram PoCs que provocaram a Tela Azul da Morte (BSOD, na sigla em inglês) em 13 das falhas, o Opus 4.8 em 15, e o Mythos Preview em 18. O Mythos Preview entregou o primeiro PoC em 31 minutos.
O Mythos Preview também foi capaz de criar exploits funcionais que levam à escalonada de privilégios em oito das vulnerabilidades, entregando todos eles em 18 horas.
Segundo a Anthropic, como normalmente leva sete dias para que os patches do Windows sejam distribuídos para 90% dos dispositivos inscritos em uma frota, e como eles tipicamente só são forçados a reiniciar no 11º dia, o modelo torna a exploração viável dentro da janela de correção.
Patches mais rápidos diante do baixo custo de exploits
"Nessa velocidade, o Mythos Preview teria terminado de criar todos os oito exploits de cadeia completa antes que qualquer dispositivo Windows tivesse recebido o patch como atualização. Transformar esses exploits em uma campanha real ainda exige trabalho adicional, mas o Mythos Preview agora reduziu uma das etapas que mais consumiam tempo para poucas horas", observa a Anthropic.
O custo de construção desses exploits também não é alto, segundo a empresa. Cada modelo recebeu um orçamento de três milhões de tokens para criar os PoCs e exploits mirando o Firefox. O custo de criar os exploits de cadeia completa mirando o Windows foi de US$ 15.700 em créditos de interface de programação de aplicações (API, na sigla em inglês), ou cerca de US$ 2.000 por escalonada de privilégios.
"A restrição limitante para as N-days agora se resume a poucos milhares de dólares e acesso a API, o que amplia drasticamente o conjunto de atacantes de N-day capazes", afirma a Anthropic.
A empresa pede um manual de patching atualizado, que deve se basear em "N-hour" em vez de "N-day", e que não deve mais presumir que transformar um patch em arma leve semanas.
"As N-days historicamente causaram a maior parte dos danos em sistemas lentos ou difíceis de corrigir. Sistemas de controle industrial, dispositivos médicos e dispositivos da 'internet das coisas' frequentemente operam em janelas de manutenção fixas, firmwares bloqueados por fornecedores, ou têm garantias de tempo de atividade. À medida que o custo de transformar qualquer patch em arma se aproxima de zero, esses dispositivos e sistemas ficarão ainda mais expostos. E mesmo sistemas que operam em uma cadência de patches 'responsável' estabelecida agora são alvos muito mais fáceis do que antes", observa a Anthropic.
Nenhum comentário publicado até agora.