Anthropic e OpenAI hanno aperto martedì un nuovo fronte nella loro rivalità, mirando entrambe alla ricerca scientifica. Anthropic ha lanciato Claude Science, una piattaforma AI per ricercatori, mentre OpenAI ha rilasciato GeneBench-Pro, un benchmark per la biologia computazionale.
I due lanci nello stesso giorno spingono la corsa all’IA oltre chatbot e programmazione, fino al lavoro in laboratorio. Un’azienda ha rilasciato uno strumento che gli scienziati possono utilizzare da subito. L’altra ha creato un metro di paragone per valutare quanto la tecnologia debba ancora progredire.
Cosa fa Claude Science di Anthropic
Claude Science riunisce i database, i codici e la potenza di calcolo utilizzati dagli scienziati all’interno di un’unica applicazione. Collega più di 60 database scientifici fra genomica, proteomica e cheminformatica.
Claude Science è un’app, non un nuovo modello. Arriva mentre i modelli più potenti di Anthropic, Fable 5 e Mythos 5, rimangono soggetti alle restrizioni all’export imposte dagli USA. Ogni risultato è verificabile e può essere ricondotto al codice che lo ha generato.
La piattaforma amplia l’impegno di Anthropic nelle scienze della vita, avviato nell’ottobre 2025. In fase beta, Jérôme Lecoq dell’Allen Institute l’ha utilizzata per riassumere revisioni che una volta richiedevano fino a due anni.
Anthropic finanzierà anche fino a 50 progetti di ricerca, con un credito massimo di 30.000 dollari ciascuno.
GeneBench-Pro di OpenAI alza l’asticella
Poco dopo il lancio di Claude Science da parte di Anthropic, OpenAI ha reso disponibile GeneBench-Pro. Esso verifica se gli agenti AI sono in grado di prendere decisioni complesse come richiesto dalla reale ricerca biologica.
Il benchmark comprende 129 problemi tra genomica, biologia quantitativa e medicina traslazionale.
Il modello più avanzato di OpenAI, GPT-5.6 Sol, ha risolto il 28,7% dei problemi al massimo livello di ragionamento. Questa percentuale sale al 31,5% in modalità Pro. Il rilascio scaglionato di GPT-5.6 da parte dell’azienda è stato effettuato su richiesta di Washington.
GPT-5 aveva ottenuto meno del 5% sul GeneBench originale, mentre Opus 4.8 di Anthropic ha raggiunto il 16% nel test più difficile.
Seguici su X per avere le ultime notizie in tempo reale
Due strategie, una corsa
Il confronto svela due percorsi verso lo stesso obiettivo. Anthropic propone un prodotto da usare ogni giorno in laboratorio. OpenAI invece misura quanto i modelli sappiano ragionare in modo affidabile di fronte a dati complessi.
Entrambi i lanci arrivano anche mentre i modelli cinesi avanzano nella ricerca AI. Gli stessi dati forniti da OpenAI attenuano l’hype, poiché anche il loro miglior modello fallisce nella maggior parte delle prove di GeneBench-Pro.
La pressione è sia geopolitica sia scientifica. I limiti all’export USA hanno già spinto Anthropic a valutare nuovi paesi ospitanti per i suoi modelli.
Secondo i revisori, ogni problema di GeneBench-Pro richiederebbe a un esperto umano dalle 20 alle 40 ore di lavoro, per un costo di migliaia di dollari. OpenAI afferma che il suo modello completa la stessa analisi con pochi dollari.
Aubrey de Grey, gerontologo biomedico, sostiene che l’intelligenza artificiale eliminerà alcuni dei principali colli di bottiglia nella ricerca, anche se i benefici più ampi richiederanno più tempo.
“Quello che vedremo molto, molto presto è che l’intelligenza artificiale renderà alcune fasi del processo, soprattutto lo sviluppo di farmaci, non più un fattore limitante,” ha dichiarato Aubrey de Grey, presidente e Chief Science Officer della Longevity Escape Velocity Foundation, durante un podcast di BeInCrypto.
De Grey ha però avvertito che trasformare una ricerca più veloce in trattamenti approvati dipende comunque dai regolamenti e dalla tolleranza pubblica al rischio.
I ricercatori si aspettano una diffusione più rapida
Alcuni specialisti sostengono che il cambiamento sia già iniziato. Il professor Derya Unutmaz, immunologo, ha dichiarato durante lo stesso panel di BeInCrypto che l’IA ora supera il suo stesso giudizio.
“Personalmente, mi fido dell’IA più delle mie idee nate in 35 anni di esperienza nel campo.”
Lui prevede che questa fiducia si diffonderà rapidamente nella pratica clinica.
“È poco etico e credo che molto presto sarà una negligenza non utilizzare l’IA in medicina.”
Questo ottimismo tuttavia precede ancora i risultati dei benchmark. I prossimi mesi mostreranno se gli scienziati adotteranno questi strumenti e se i punteggi di GeneBench-Pro inizieranno a crescere.









