Anthropic e OpenAI portano la loro guerra sull’AI anche nella ricerca scientifica

Sceglici su Google

Scritto da

Lockridge Okoth

Modificato da

Mohammad Shahid

30 giugno 2026, 20:43 CET

Anthropic ha lanciato Claude Science, un workbench di intelligenza artificiale collegato a oltre 60 database scientifici.
OpenAI ha rilasciato GeneBench-Pro, un benchmark per valutare il giudizio dell’IA in biologia computazionale.
Il miglior modello di OpenAI ha superato solo il 28,7% dei problemi di biologia di GeneBench-Pro.

#Aziende di IA

#Notizie sull'IA

#Approfondimenti IA

Anthropic e OpenAI hanno aperto martedì un nuovo fronte nella loro rivalità, mirando entrambe alla ricerca scientifica. Anthropic ha lanciato Claude Science, una piattaforma AI per ricercatori, mentre OpenAI ha rilasciato GeneBench-Pro, un benchmark per la biologia computazionale.

I due lanci nello stesso giorno spingono la corsa all’IA oltre chatbot e programmazione, fino al lavoro in laboratorio. Un’azienda ha rilasciato uno strumento che gli scienziati possono utilizzare da subito. L’altra ha creato un metro di paragone per valutare quanto la tecnologia debba ancora progredire.

Contenuto sponsorizzato

Cosa fa Claude Science di Anthropic

Claude Science riunisce i database, i codici e la potenza di calcolo utilizzati dagli scienziati all’interno di un’unica applicazione. Collega più di 60 database scientifici fra genomica, proteomica e cheminformatica.

Introducing Claude Science, a new app designed with every stage of research in mind.

Artifacts traced to their code, environments managed on demand, and 60+ optional scientific databases that you can connect.

Available now in beta. pic.twitter.com/HKhLknxLJO
— Claude (@claudeai) June 30, 2026

Claude Science è un’app, non un nuovo modello. Arriva mentre i modelli più potenti di Anthropic, Fable 5 e Mythos 5, rimangono soggetti alle restrizioni all’export imposte dagli USA. Ogni risultato è verificabile e può essere ricondotto al codice che lo ha generato.

La piattaforma amplia l’impegno di Anthropic nelle scienze della vita, avviato nell’ottobre 2025. In fase beta, Jérôme Lecoq dell’Allen Institute l’ha utilizzata per riassumere revisioni che una volta richiedevano fino a due anni.

Anthropic finanzierà anche fino a 50 progetti di ricerca, con un credito massimo di 30.000 dollari ciascuno.

GeneBench-Pro di OpenAI alza l’asticella

Poco dopo il lancio di Claude Science da parte di Anthropic, OpenAI ha reso disponibile GeneBench-Pro. Esso verifica se gli agenti AI sono in grado di prendere decisioni complesse come richiesto dalla reale ricerca biologica.

We’re introducing GeneBench-Pro, a research-level benchmark for a harder kind of AI progress: how well agents can navigate messy biological data, choose the right analysis path, and make judgment calls that real computational research depends on.https://t.co/AsilnnSxnE
— OpenAI (@OpenAI) June 30, 2026

Contenuto sponsorizzato

Il benchmark comprende 129 problemi tra genomica, biologia quantitativa e medicina traslazionale.

Il modello più avanzato di OpenAI, GPT-5.6 Sol, ha risolto il 28,7% dei problemi al massimo livello di ragionamento. Questa percentuale sale al 31,5% in modalità Pro. Il rilascio scaglionato di GPT-5.6 da parte dell’azienda è stato effettuato su richiesta di Washington.

GPT-5 aveva ottenuto meno del 5% sul GeneBench originale, mentre Opus 4.8 di Anthropic ha raggiunto il 16% nel test più difficile.

Seguici su X per avere le ultime notizie in tempo reale

Due strategie, una corsa

Il confronto svela due percorsi verso lo stesso obiettivo. Anthropic propone un prodotto da usare ogni giorno in laboratorio. OpenAI invece misura quanto i modelli sappiano ragionare in modo affidabile di fronte a dati complessi.

Contenuto sponsorizzato

Entrambi i lanci arrivano anche mentre i modelli cinesi avanzano nella ricerca AI. Gli stessi dati forniti da OpenAI attenuano l’hype, poiché anche il loro miglior modello fallisce nella maggior parte delle prove di GeneBench-Pro.

La pressione è sia geopolitica sia scientifica. I limiti all’export USA hanno già spinto Anthropic a valutare nuovi paesi ospitanti per i suoi modelli.

Secondo i revisori, ogni problema di GeneBench-Pro richiederebbe a un esperto umano dalle 20 alle 40 ore di lavoro, per un costo di migliaia di dollari. OpenAI afferma che il suo modello completa la stessa analisi con pochi dollari.

Aubrey de Grey, gerontologo biomedico, sostiene che l’intelligenza artificiale eliminerà alcuni dei principali colli di bottiglia nella ricerca, anche se i benefici più ampi richiederanno più tempo.

“Quello che vedremo molto, molto presto è che l’intelligenza artificiale renderà alcune fasi del processo, soprattutto lo sviluppo di farmaci, non più un fattore limitante,” ha dichiarato Aubrey de Grey, presidente e Chief Science Officer della Longevity Escape Velocity Foundation, durante un podcast di BeInCrypto.

De Grey ha però avvertito che trasformare una ricerca più veloce in trattamenti approvati dipende comunque dai regolamenti e dalla tolleranza pubblica al rischio.

I ricercatori si aspettano una diffusione più rapida

Alcuni specialisti sostengono che il cambiamento sia già iniziato. Il professor Derya Unutmaz, immunologo, ha dichiarato durante lo stesso panel di BeInCrypto che l’IA ora supera il suo stesso giudizio.

“Personalmente, mi fido dell’IA più delle mie idee nate in 35 anni di esperienza nel campo.”

Lui prevede che questa fiducia si diffonderà rapidamente nella pratica clinica.

“È poco etico e credo che molto presto sarà una negligenza non utilizzare l’IA in medicina.”

Questo ottimismo tuttavia precede ancora i risultati dei benchmark. I prossimi mesi mostreranno se gli scienziati adotteranno questi strumenti e se i punteggi di GeneBench-Pro inizieranno a crescere.

Per leggere le ultime analisi di mercato sulle criptovalute di BeInCrypto, clicca qui .

Disclaimer

Tutte le informazioni contenute nel nostro sito web sono pubblicate in buona fede e solo a scopo informativo generale. Qualsiasi azione intrapresa dal lettore in base alle informazioni contenute nel nostro sito web è strettamente a suo rischio e pericolo.

Contenuto sponsorizzato

Leggi il prossimo

Vitalik Buterin propone un linguaggio per rendere leggibili le prove AI

Notizie

Tecnologia

17 ore fa

Vitalik Buterin propone un linguaggio per rendere leggibili le prove AI