La Claude Mythos Preview di Anthropic è diventata il primo modello di intelligenza artificiale a completare con successo un attacco completo simulato a una rete aziendale, secondo le nuove valutazioni dell’AI Security Institute (AISI) del Regno Unito.
I risultati, pubblicati pochi giorni dopo l’annuncio del modello il 7 aprile, suggeriscono che le capacità cyber delle AI hanno raggiunto un livello che richiede un’attenzione immediata da parte dei team di sicurezza in tutto il mondo.
Che cos’è Claude Mythos?
Anthropic ha presentato il suo modello Claude Mythos Preview il 7 aprile, scegliendo di non rilasciarla pubblicamente su larga scala. Il team concede invece accesso limitato a società di ricerca sulla sicurezza per valutare e prepararsi alle sue avanzate capacità.
“Questo modello si comporta molto bene in tutti i campi, ma si distingue particolarmente per i compiti relativi alla sicurezza informatica. In risposta, abbiamo avviato Project Glasswing, un’iniziativa che utilizza Mythos Preview per aiutare a proteggere il software più critico al mondo e per preparare il settore alle pratiche che tutti dovremo adottare per restare un passo avanti rispetto ai cyberattaccanti”, si legge nell’ annuncio.
Seguici su X per ricevere le ultime notizie in tempo reale
Lo sviluppo ha già iniziato a destare attenzione sia nel settore tecnologico che in quello politico. Secondo Reuters, citando fonti vicine alla questione, il Segretario al Tesoro USA Scott Bessent e il Presidente della Federal Reserve Jerome Powell hanno tenuto un incontro urgente con i CEO delle principali banche, avvertendoli riguardo ai potenziali rischi cyber legati a questo modello.
Come si è comportata Claude Mythos Preview
L’AI Security Institute (AISI), un’organizzazione di ricerca all’interno del Dipartimento per la Scienza, l’Innovazione e la Tecnologia del governo britannico, ha condotto valutazioni cyber su Claude Mythos Preview di Anthropic per valutare le sue capacità di cybersicurezza.
Le prime prove sono state le valutazioni “capture-the-flag” (CTF), in cui i sistemi devono individuare ed esplorare vulnerabilità per recuperare “flag” nascoste. Mythos ha raggiunto un tasso di successo del 73% nei compiti di livello esperto: nessun modello era mai riuscito in questo risultato prima di aprile 2025.
Inoltre, AISI ha realizzato una simulazione di attacco a una rete aziendale in 32 passaggi chiamata “The Last Ones” (TLO). I professionisti della sicurezza impiegherebbero circa 20 ore per completarla.
Mythos Preview ha completato l’intera simulazione in 3 tentativi su 10. In media, ha portato a termine 22 dei 32 passaggi d’attacco. Claude Opus 4.6, la seconda migliore, ne ha completati in media solo 16.
“Il successo di Mythos Preview su una cyber range indica che è almeno in grado di attaccare autonomamente sistemi aziendali piccoli, debolmente difesi e vulnerabili in cui sia già stato ottenuto l’accesso alla rete. Tuttavia, le nostre cyber range presentano differenze importanti rispetto agli ambienti reali che le rendono bersagli più facili”, ha aggiunto il team.
I test interni di Anthropic hanno mostrato che Claude Mythos Preview è in grado di rilevare ed esplorare vulnerabilità zero-day su tutti i principali sistemi operativi e browser web quando riceve istruzioni esplicite dall’utente.
“Possiamo spiegare in dettaglio solo una parte delle nostre scoperte. Oltre il 99% delle vulnerabilità trovate non è ancora stato corretto, quindi sarebbe irresponsabile rivelarne i dettagli”, ha dichiarato il team.
AISI ha sottolineato che le organizzazioni dovrebbero dare priorità alle misure fondamentali di cybersecurity, tra cui aggiornamenti regolari, controlli rigorosi degli accessi, rafforzamento della configurazione della sicurezza e log completi.
Iscriviti al nostro canale YouTube per guardare leader e giornalisti condividere approfondimenti da esperti





