Il modello di intelligenza artificiale Evo2 inaugura una nuova fase della biologia generativa, permettendo alle macchine di comprendere e manipolare il linguaggio del DNA.
Sviluppato da Arc Institute insieme a Nvidia, Stanford e Università della California, è stato addestrato su 9 mila miliardi di nucleotidi provenienti da 128mila genomi di specie diverse.
Evo2 è in grado di analizzare sequenze genetiche fino a un milione di nucleotidi e individuare mutazioni legate a malattie, raggiungendo oltre il 90% di accuratezza nello studio del gene BRCA1 associato al tumore al seno.
Il sistema può accelerare la scoperta delle cause genetiche delle malattie e la progettazione di terapie geniche più mirate, riducendo tempi e costi della ricerca.
Le sue capacità, però, sono state limitate per evitare usi rischiosi come la progettazione di organismi potenzialmente pericolosi.
Tag: LLM
-
Evo2, l’AI che legge e riscrive il DNA per scoprire mutazioni e progettare terapie
-
Tratta gli LLM come strumenti più competenti di te, e scoprirai nuove strategie per ottenere risultati migliori
Oggi vi consiglio la lettura di un articolo pubblicato su XDA Developers che suggerisce come, per sfruttare davvero i modelli linguistici avanzati, sia utile trattarli come “sistemi più competenti dell’utente” in specifici compiti, fornendo di conseguenza istruzioni precise e strutturate invece di intavolare conversazioni informali.
Poiché gli LLM operano tramite token e hanno limiti di contesto, in molti casi prompt brevi e diretti possono migliorare l’accuratezza delle risposte, ma l’articolo raccomanda anche di considerare la prima risposta come una bozza e di applicare un metodo “socratico” per verificare e migliorare progressivamente l’output (e qui al caro Gianluigi Bonanomi fischieranno le orecchie).
Per ridurre le allucinazioni e aumentare la qualità dei risultati è sempre utile, inoltre, integrare fonti esterne tramite tecniche come Retrieval-Augmented Generation (RAG, fondamentale per esempio in NotebookLM) oppure server MCP che colleghi ad applicazioni e fonti esterne, fornendo soprattutto al modello documentazione aggiornata e contesto rilevante.
Infine, definire chiaramente ruolo del modello e formato dell’output (ad esempio JSON o Markdown) permette di ottenere risposte più strutturate e facilmente automatizzabili.
Link alla fonte:
https://www.xda-developers.com/start-treating-your-llms-as-smarter-than-you-because-they-are
-
I modelli di AI affrontano “Humanity’s Last Exam” per misurare la distanza dalla AGI
I principali modelli di intelligenza artificiale — ChatGPT, Gemini, Claude e DeepSeek — sono stati sottoposti a Humanity’s Last Exam, un benchmark estremo progettato per valutare quanto siano vicini al livello di conoscenza degli esperti umani.
Il test, pubblicato sulla rivista Nature e sviluppato dal Center for AI Safety insieme a Scale AI, comprende 2.500 domande di livello dottorale distribuite su oltre 100 discipline.
A febbraio 2026 il miglior risultato è stato ottenuto da Gemini 3 Deep Think con il 48,4%, ancora distante dal circa 90% raggiunto dagli esperti umani nei rispettivi campi.
I ricercatori sottolineano che, nonostante i rapidi progressi, superare questo benchmark non equivarrebbe automaticamente a raggiungere l’intelligenza artificiale generale (AGI).
Lo studio riaccende quindi il dibattito su quanto tempo manchi davvero prima che l’IA raggiunga capacità paragonabili a quelle umane nella ricerca e nel ragionamento avanzato.Link alla fonte:
https://www.elconfidencial.com/tecnologia/2026-03-05/ia-ultimo-examen-humanidad-agi-1qrt_4313376/
