OpenAI lancia GPT-5.5 per sfidare Claude Opus 4.7 di Anthropic

  • OpenAI ha rilasciato oggi GPT-5.5, affermando di avere superato Claude Opus 4.7 nei benchmark.
  • Il modello punta alla programmazione agentica, all’uso di strumenti e al completamento autonomo dei task.
  • Il prezzo dell’API parte da 5 dollari per milione di token in input, in linea con le tariffe di Anthropic.
Promo

OpenAI ha rilasciato GPT-5.5 il 23 aprile, nome in codice “Spud”, posizionando il modello come il suo sistema più avanzato per lavori autonomi e multi-step.

Il lancio arriva una settimana dopo che Anthropic ha presentato Claude Opus 4.7, aprendo così un confronto diretto tra i due modelli di punta.

Contenuto sponsorizzato
Contenuto sponsorizzato

GPT-5.5 punta su lavoro agentico e programmazione

GPT-5.5 è progettato per pianificare, eseguire, verificare e iterare utilizzando diversi strumenti senza supervisione umana costante. OpenAI lo descrive come “una nuova classe di intelligenza per il lavoro reale e per potenziare gli agenti”.

Seguici su X per ricevere le ultime notizie in tempo reale

“Crediamo nel deployment iterativo; anche se GPT-5.5 è già un modello intelligente, ci aspettiamo rapidi miglioramenti. Il deployment iterativo è una parte fondamentale della nostra strategia di sicurezza: crediamo che il mondo sia meglio attrezzato per vincere a livello di squadra la resilienza nell’AI in questo modo”, ha scritto Sam Altman in un post.

Il modello è disponibile da subito per gli utenti di ChatGPT Plus, Pro, Business ed Enterprise. È disponibile anche una variante Pro ancora più potente. I prezzi per l’API partono da $5 per milione di token in input e $30 per milione di token in output, con una finestra di contesto da un milione di token.

Contenuto sponsorizzato
Contenuto sponsorizzato

I benchmark interni di OpenAI mostrano che GPT-5.5 supera Claude Opus 4.7 in diversi compiti agentici. Ha ottenuto un punteggio dell’82,7% su Terminal-Bench 2.0, contro il 69,4% di Opus 4.7.

Sui test FrontierMath livelli 1-3, ha raggiunto il 51,7% contro il 43,8%. I primi test indipendenti hanno inoltre riscontrato trend simili su valutazioni di programmazione e lavori di conoscenza.

Dove Claude Opus 4.7 è ancora in testa

Secondo alcuni revisori indipendenti, il modello di Anthropic mantiene dei vantaggi nella scrittura accademica, nel ragionamento legale e finanziario e nella coerenza nel seguire le istruzioni.

Opus 4.7 inoltre supporta una visione ad alta risoluzione fino a 3,75 megapixel, più di tre volte superiore al suo predecessore.

Contenuto sponsorizzato
Contenuto sponsorizzato

Per quanto riguarda l’uso del computer, il divario si riduce. GPT-5.5 ha ottenuto il 78,7% nel test OSWorld-Verified, mentre Opus 4.7 si è fermato al 78%.

I due modelli inoltre si alternano ai vertici dei benchmark di navigazione web, con GPT-5.5 Pro che raggiunge il 90,1% contro il 79,3% di Opus 4.7.

La corsa all’AI accelera nel 2026

I lanci ravvicinati riflettono un trend più ampio. OpenAI ha rilasciato diverse varianti di GPT-5.x quest’anno, mentre Anthropic ha aggiornato in modo costante Claude con nuove versioni.

Anche Gemini 3.1 Pro di Google punta allo stesso mercato enterprise.

Per gli sviluppatori chiamati a scegliere tra i due modelli, la decisione dipenderà anche dal caso d’uso specifico. GPT-5.5 sembra più forte per automazione agentica e programmazione di lungo periodo.

Claude Opus 4.7 può essere più indicato per flussi di lavoro analitici che richiedono alta precisione. Se i benchmark indipendenti confermeranno i numeri pubblicati da OpenAI sarà più chiaro nei prossimi giorni.

Iscriviti al nostro canale YouTube per guardare leader e giornalisti offrire approfondimenti esperti


Per leggere le ultime analisi di mercato sulle criptovalute di BeInCrypto, clicca qui.

Disclaimer

Tutte le informazioni contenute nel nostro sito web sono pubblicate in buona fede e solo a scopo informativo generale. Qualsiasi azione intrapresa dal lettore in base alle informazioni contenute nel nostro sito web è strettamente a suo rischio e pericolo.

Contenuto sponsorizzato
Contenuto sponsorizzato