Il ritorno di Mythos, i test di Anthropic mostrano che Fable 5 non era un rischio unico

  • I test mostrano che Opus 4.8, GPT-5.5 e Kimi K2.7 potrebbero individuare le stesse vulnerabilità.
  • Claude Fable 5 torna a livello globale, con maggiori tutele, il 2 luglio.
  • I nuovi classificatori di Fable 5 segnalano anche attività di coding e debugging più innocue.
Promo

Anthropic afferma che i test interni hanno rilevato che Claude Fable 5 non comportava nessun pericolo unico per la cybersecurity, mentre Claude Mythos 5 ritorna a livello globale il 2 luglio.

Questa dichiarazione accompagna il rilancio globale di Fable 5, che conclude una sospensione di 18 giorni scattata dalle restrizioni alle esportazioni imposte dagli USA il 12 giugno. Anthropic ha testato modelli concorrenti per valutare la reale minaccia alla base della restrizione.

Contenuto sponsorizzato
Contenuto sponsorizzato

Perché Anthropic ha sospeso Fable 5

Fable 5 e Mythos 5 sono stati lanciati il 9 giugno, condividendo lo stesso modello base, con il primo accessibile al pubblico. Mythos 5 invece è rimasto limitato a un numero ristretto di partner affidabili di Project Glasswing impegnati in attività di cybersecurity difensiva.

Le restrizioni all’esportazione sono arrivate dopo che ricercatori di Amazon hanno trovato un modo per aggirare le protezioni di Fable 5. La tecnica ha indotto il modello a individuare vulnerabilità software e, in un caso, a dimostrare anche un exploit.

I test di Anthropic hanno rivelato che anche Claude Opus 4.8, GPT-5.5 e Kimi K2.7 potevano individuare le stesse vulnerabilità segnalate da Fable 5 nel report di Amazon. Ogni modello testato è stato anche in grado di riprodurre l’unica dimostrazione di exploit.

Questa scoperta suggerisce che la direttiva abbia preso di mira una lacuna condivisa da tutta l’industria, e non una minaccia specifica di Fable. Anthropic ha comunque creato un classificatore più robusto per bloccare la tecnica, che ora segnala anche richieste di programmazione e debug più ordinarie.

Come funzionano realmente le protezioni

Fable 5 è stato lanciato con il margine di sicurezza più elevato mai implementato da Anthropic in un suo modello. I suoi classificatori bloccano richieste che appaiono anche solo lievemente rischiose, non solo quelle evidentemente dannose. Il nuovo classificatore, addestrato dopo il report di Amazon, blocca la tecnica segnalata in oltre il 99% dei casi, secondo Anthropic. Le richieste bloccate ora vengono reindirizzate automaticamente a Opus 4.8.

Questo ulteriore margine di sicurezza comporta degli svantaggi. Anthropic riconosce che il classificatore ora segnala più spesso anche richieste di programmazione e debug innocue, e afferma che continuerà ad affinarlo per ridurre i falsi positivi. Mythos 5, che ha meno barriere di questo tipo, è tornato disponibile solo per le istituzioni Mythos 5 autorizzate dal governo il 26 giugno.

I dati raccolti da Anthropic sollevano una domanda più difficile. Se anche modelli meno avanzati sono già in grado di fare ciò per cui Fable 5 era stato vietato, quale standard applicheranno le autorità di regolamentazione la prossima volta che sarà lanciato un modello di frontiera?


Per leggere le ultime analisi di mercato sulle criptovalute di BeInCrypto, clicca qui.

Disclaimer

Tutte le informazioni contenute nel nostro sito web sono pubblicate in buona fede e solo a scopo informativo generale. Qualsiasi azione intrapresa dal lettore in base alle informazioni contenute nel nostro sito web è strettamente a suo rischio e pericolo.

Contenuto sponsorizzato
Contenuto sponsorizzato