EUA pedindo que revogue a ordem de controle de exportação dos modelos Fable e Mythos da Anthropic.
Segundo a carta aberta, “essa ação retirou os melhores modelos dos defensores [da cibersegurança]”, que agora não podem usar esses modelos para encontrar vulnerabilidades e tornar seus softwares e produtos mais seguros.
“Retirar as melhores capacidades dos defensores sem um bom motivo, quando nossos adversários estão avançando rapidamente, é perigoso”, dizia a carta.
Na sexta-feira, o governo dos EUA ordenou à Anthropic que limitasse a exportação de Fable e Mythos , alegando preocupações com a segurança nacional, sem explicar os motivos específicos da ordem, segundo a Anthropic . Em resposta, a empresa suspendeu o acesso aos modelos para todos os usuários do mundo.
Até o momento da redação deste texto, a carta conta com a assinatura de 76 especialistas em cibersegurança, incluindo: Alex Stamos, ex-chefe de segurança do Facebook; Casey Ellis, fundador da plataforma de recompensas por bugs Bugcrowd; Jon Callas, renomado criptógrafo e ex-gerente de design e arquitetura de segurança da Apple; Paul Vixie, cientista da computação; Dino Dai Zovi, ex-chefe de engenharia de segurança aplicada da Block; Katie Mossouris, fundadora da Luta Security; e Rachel Tobac, CEO da empresa de treinamento em conscientização de segurança SocialProof Security.
Quando o Mythos foi lançado em versão prévia em abril, a Anthropic afirmou que ele era tão poderoso na detecção de vulnerabilidades de segurança que a empresa precisou restringir rigorosamente o acesso para impedir que hackers maliciosos ou adversários estrangeiros o utilizassem para causar estragos na internet. Na prática, isso significou que a Anthropic concedeu acesso inicial ao Mythos a cerca de 50 empresas, expandindo recentemente esse grupo para incluir cerca de 150 organizações em 15 países.
Na semana passada, a Anthropic lançou o Fable , uma versão pública do Mythos que, segundo a empresa, possuía rígidas salvaguardas para impedir seu uso nas áreas de biologia, química e segurança cibernética, bem como para evitar que outros extraíssem o modelo para recriá-lo. As salvaguardas do Fable eram tão rigorosas que muitos especialistas em segurança cibernética constataram que ele bloqueava praticamente qualquer solicitação relacionada à segurança cibernética .
A Anthropic afirmou que a ordem de controle de exportação da Casa Branca pode ter sido baseada em um relatório que indicava a existência de um método para burlar — ou seja, “quebrar o bloqueio” — o Fable, a fim de desbloquear suas poderosas capacidades de nível Mythos
Segundo Katie Moussouris, uma das signatárias da carta aberta, o método foi demonstrado por pesquisadores da Amazon em um artigo que não é público, mas que ela revisou.
Mas Moussouris afirmou em uma postagem no blog que o artigo não demonstrou, de fato, um jailbreak real. Em vez disso, escreveu ela, os pesquisadores simplesmente pediram à Fable que corrigisse o código aberto com vulnerabilidades públicas e conhecidas, além de “vulnerabilidades deliberadamente inseridas”, depois que o modelo inicialmente se recusou a “revisar o código em busca de problemas de segurança”.
“O comportamento descrito no artigo não pode ser corrigido de forma significativa, e qualquer tentativa apenas enfraqueceria o modelo de defesa”, escreveu Moussouris. “Os responsáveis pela segurança precisam poder pedir à IA para corrigir os erros em um arquivo, explicar por que a correção é importante e escrever testes que confirmem que a correção funciona. Isso não é uma mera burla às normas de segurança. É a coisa mais valiosa que um modelo de IA pode fazer pela segurança defensiva: executar o ciclo de busca, correção e teste que os responsáveis pela segurança realizam todos os dias.”
A crítica de Moussouris foi reiterada na carta aberta, que também afirmou que o grupo de especialistas acredita que o método descrito no artigo da Amazon “pode ser replicado” no GPT-5.5 da OpenAI, no Claude Opus 4.8 e no Sonnet, ambos disponíveis publicamente pela Anthropic, “e até mesmo em modelos chineses como o Kimi 2.7”.
A carta também solicitava regulamentações transparentes e aplicadas de forma justa, criadas por “um processo democrático de elaboração de normas”, baseadas em pesquisas científicas realizadas por especialistas da indústria e da academia, e “utilizadas apenas na medida mínima necessária para garantir a segurança do público americano”.
