Veteranos da área de cibersegurança protestam contra a proibição “perigosa” do governo dos EUA aos modelos mais poderosos da Anthropic

Um grupo formado por dezenas de especialistas em cibersegurança, incluindo vários veteranos renomados do setor, publicou uma carta aberta ao governo dos

EUA pedindo que revogue a ordem de controle de exportação dos modelos Fable e Mythos da Anthropic.

Segundo a carta aberta, “essa ação retirou os melhores modelos dos defensores [da cibersegurança]”, que agora não podem usar esses modelos para encontrar vulnerabilidades e tornar seus softwares e produtos mais seguros. 

“Retirar as melhores capacidades dos defensores sem um bom motivo, quando nossos adversários estão avançando rapidamente, é perigoso”, dizia a carta.

Na sexta-feira, o governo dos EUA ordenou à Anthropic que limitasse a exportação de Fable e Mythos , alegando preocupações com a segurança nacional, sem explicar os motivos específicos da ordem, segundo a Anthropic . Em resposta, a empresa suspendeu o acesso aos modelos para todos os usuários do mundo. 

Até o momento da redação deste texto, a carta conta com a assinatura de 76 especialistas em cibersegurança, incluindo: Alex Stamos, ex-chefe de segurança do Facebook; Casey Ellis, fundador da plataforma de recompensas por bugs Bugcrowd; Jon Callas, renomado criptógrafo e ex-gerente de design e arquitetura de segurança da Apple; Paul Vixie, cientista da computação; Dino Dai Zovi, ex-chefe de engenharia de segurança aplicada da Block; Katie Mossouris, fundadora da Luta Security; e Rachel Tobac, CEO da empresa de treinamento em conscientização de segurança SocialProof Security. 

Quando o Mythos foi lançado em versão prévia em abril, a Anthropic afirmou que ele era tão poderoso na detecção de vulnerabilidades de segurança que a empresa precisou restringir rigorosamente o acesso para impedir que hackers maliciosos ou adversários estrangeiros o utilizassem para causar estragos na internet. Na prática, isso significou que a Anthropic concedeu acesso inicial ao Mythos a cerca de 50 empresas, expandindo recentemente esse grupo para incluir cerca de 150 organizações em 15 países.

Na semana passada, a Anthropic lançou o Fable , uma versão pública do Mythos que, segundo a empresa, possuía rígidas salvaguardas para impedir seu uso nas áreas de biologia, química e segurança cibernética, bem como para evitar que outros extraíssem o modelo para recriá-lo. As salvaguardas do Fable eram tão rigorosas que muitos especialistas em segurança cibernética constataram que ele bloqueava praticamente qualquer solicitação relacionada à segurança cibernética . 

A Anthropic afirmou que a ordem de controle de exportação da Casa Branca pode ter sido baseada em um relatório que indicava a existência de um método para burlar — ou seja, “quebrar o bloqueio” — o Fable, a fim de desbloquear suas poderosas capacidades de nível Mythos

Segundo Katie Moussouris, uma das signatárias da carta aberta, o método foi demonstrado por pesquisadores da Amazon em um artigo que não é público, mas que ela revisou. 

Mas Moussouris afirmou em uma postagem no blog que o artigo não demonstrou, de fato, um jailbreak real. Em vez disso, escreveu ela, os pesquisadores simplesmente pediram à Fable que corrigisse o código aberto com vulnerabilidades públicas e conhecidas, além de “vulnerabilidades deliberadamente inseridas”, depois que o modelo inicialmente se recusou a “revisar o código em busca de problemas de segurança”.

“O comportamento descrito no artigo não pode ser corrigido de forma significativa, e qualquer tentativa apenas enfraqueceria o modelo de defesa”, escreveu Moussouris. “Os responsáveis ​​pela segurança precisam poder pedir à IA para corrigir os erros em um arquivo, explicar por que a correção é importante e escrever testes que confirmem que a correção funciona. Isso não é uma mera burla às normas de segurança. É a coisa mais valiosa que um modelo de IA pode fazer pela segurança defensiva: executar o ciclo de busca, correção e teste que os responsáveis ​​pela segurança realizam todos os dias.”

A crítica de Moussouris foi reiterada na carta aberta, que também afirmou que o grupo de especialistas acredita que o método descrito no artigo da Amazon “pode ​​ser replicado” no GPT-5.5 da OpenAI, no Claude Opus 4.8 e no Sonnet, ambos disponíveis publicamente pela Anthropic, “e até mesmo em modelos chineses como o Kimi 2.7”.

A carta também solicitava regulamentações transparentes e aplicadas de forma justa, criadas por “um processo democrático de elaboração de normas”, baseadas em pesquisas científicas realizadas por especialistas da indústria e da academia, e “utilizadas apenas na medida mínima necessária para garantir a segurança do público americano”.

Compartilhar Artigo

Artigos Relacionados