Diz-se que nenhum jailbreak é responsável por bloquear os poderosos modelos de IA de Fable 5 e Mythos 5, mas apenas seguindo o simples pedido “consertar este código”. Pelo menos é o que afirma a pesquisadora de segurança de TI Katie Moussouris, que teve permissão para ver o relatório que levou o governo dos EUA a ordenar o bloqueio com base na diretiva de controle de exportação. O relatório explica que os pesquisadores apresentaram os modelos de IA do Fable 5, Mythos e Opus com código-fonte aberto com falhas de segurança conhecidas e aqueles com lacunas inseridas intencionalmente. Fable 5 rejeita pedidos para “verificar o código em busca de falhas de segurança”. O modelo então obedece à solicitação de “consertar o código”.
Leia mais depois do anúncio
Jailbreak ou não?
Moussouris disse ser o único especialista independente que pôde ver o relatório. Ele continua dizendo que a resposta para “consertar este código” é transformada em um script que verifica patches publicados usando um “processo manual e de vários estágios”. Isto é tudo e, na minha opinião, não deveria ter resultado numa proibição de exportação. Qualquer pessoa dedicada à defesa contra ataques cibernéticos deve ter permissão para usar a tecnologia de IA para se proteger contra lacunas no código, explicar seu significado e escrever testes para testes. Isto não é um desvio das grades de proteção, como afirmado. Pelo contrário, esta é a coisa mais valiosa que os modelos de IA podem fazer para a defesa cibernética.
Moussouris disse que é hora de camisetas que dizem “consertar este código” e explicou que essas palavras são munição
(Lance: lutasecurity.com)
O especialista também garante que sabe sobre o que está escrevendo. Há mais de uma década, participou nas negociações para melhorar o Acordo de Wassenaar sobre controlos de exportação e garantir que sejam incluídas exceções para atividades de defesa. Limitar os modelos de IA da mesma forma que hoje prejudicaria as defesas cibernéticas sem limitar os ciberatores criminosos. Desde então, Moussouris, juntamente com vários especialistas, pediu ao governo dos EUA que revisse as medidas contra Fable 5 e Mythos 5 e levantasse a proibição. Isso também mostra o quão importante o modelo é para o trabalho. Mas as negociações para suspender a proibição fracassaram na segunda-feira.
A Anthropic lançou o Fable 5 na última terça-feira como uma variante de conteúdo limitado do novo Mythos 5. Os testes iniciais confirmaram o melhor desempenho dos modelos de IA, mas também levaram a críticas às medidas de segurança, que desencadearam repetidamente uma recaída em modelos menos poderosos. Na sexta-feira, a Anthropic bloqueou repentinamente o acesso ao Fable 5 e Mythos 5 – para todos os usuários em todo o mundo. Segundo relatos, os relatórios do CEO da Amazon, Andy Jassy, sobre a suspeita de jailbreak são os principais responsáveis. Este é o relatório a que Moussouris se referiu. Aparentemente, também há indícios de que um grupo ligado ao governo chinês tenha acesso a um poderoso modelo de IA da Mythos.
A comunicação é difícil com o governo dos EUA
Leia mais depois do anúncio
O Financial Times agora está relatando que a Anthropic teve apenas 90 minutos para responder aos relatos da suposta fuga da prisão. As empresas de IA garantiram agora que este não é um método limitado aos seus próprios modelos de IA. Eles também trabalharão com os da OpenAI, por exemplo. Isto se enquadra na explicação de Moussouris. Entretanto, a revista norte-americana Axios relata que o governo dos EUA tem a impressão de que a Anthropic lhes mentiu. Uma pessoa anônima explicou a dificuldade de entendimento como se as duas partes falassem línguas diferentes.
(meu)



