OpenAI ha rilasciato GPT-5.5 il 23 aprile, nome in codice “Spud”, posizionando il modello come il suo sistema più avanzato per lavori autonomi e multi-step.
Il lancio arriva una settimana dopo che Anthropic ha presentato Claude Opus 4.7, aprendo così un confronto diretto tra i due modelli di punta.
GPT-5.5 punta su lavoro agentico e programmazione
GPT-5.5 è progettato per pianificare, eseguire, verificare e iterare utilizzando diversi strumenti senza supervisione umana costante. OpenAI lo descrive come “una nuova classe di intelligenza per il lavoro reale e per potenziare gli agenti”.
Seguici su X per ricevere le ultime notizie in tempo reale
“Crediamo nel deployment iterativo; anche se GPT-5.5 è già un modello intelligente, ci aspettiamo rapidi miglioramenti. Il deployment iterativo è una parte fondamentale della nostra strategia di sicurezza: crediamo che il mondo sia meglio attrezzato per vincere a livello di squadra la resilienza nell’AI in questo modo”, ha scritto Sam Altman in un post.
Il modello è disponibile da subito per gli utenti di ChatGPT Plus, Pro, Business ed Enterprise. È disponibile anche una variante Pro ancora più potente. I prezzi per l’API partono da $5 per milione di token in input e $30 per milione di token in output, con una finestra di contesto da un milione di token.
I benchmark interni di OpenAI mostrano che GPT-5.5 supera Claude Opus 4.7 in diversi compiti agentici. Ha ottenuto un punteggio dell’82,7% su Terminal-Bench 2.0, contro il 69,4% di Opus 4.7.
Sui test FrontierMath livelli 1-3, ha raggiunto il 51,7% contro il 43,8%. I primi test indipendenti hanno inoltre riscontrato trend simili su valutazioni di programmazione e lavori di conoscenza.
Dove Claude Opus 4.7 è ancora in testa
Secondo alcuni revisori indipendenti, il modello di Anthropic mantiene dei vantaggi nella scrittura accademica, nel ragionamento legale e finanziario e nella coerenza nel seguire le istruzioni.
Opus 4.7 inoltre supporta una visione ad alta risoluzione fino a 3,75 megapixel, più di tre volte superiore al suo predecessore.
Per quanto riguarda l’uso del computer, il divario si riduce. GPT-5.5 ha ottenuto il 78,7% nel test OSWorld-Verified, mentre Opus 4.7 si è fermato al 78%.
I due modelli inoltre si alternano ai vertici dei benchmark di navigazione web, con GPT-5.5 Pro che raggiunge il 90,1% contro il 79,3% di Opus 4.7.
La corsa all’AI accelera nel 2026
I lanci ravvicinati riflettono un trend più ampio. OpenAI ha rilasciato diverse varianti di GPT-5.x quest’anno, mentre Anthropic ha aggiornato in modo costante Claude con nuove versioni.
Anche Gemini 3.1 Pro di Google punta allo stesso mercato enterprise.
Per gli sviluppatori chiamati a scegliere tra i due modelli, la decisione dipenderà anche dal caso d’uso specifico. GPT-5.5 sembra più forte per automazione agentica e programmazione di lungo periodo.
Claude Opus 4.7 può essere più indicato per flussi di lavoro analitici che richiedono alta precisione. Se i benchmark indipendenti confermeranno i numeri pubblicati da OpenAI sarà più chiaro nei prossimi giorni.
Iscriviti al nostro canale YouTube per guardare leader e giornalisti offrire approfondimenti esperti





