Tag: LLM

  • Evo2, l’AI che legge e riscrive il DNA per scoprire mutazioni e progettare terapie

    Il modello di intelligenza artificiale Evo2 inaugura una nuova fase della biologia generativa, permettendo alle macchine di comprendere e manipolare il linguaggio del DNA.
    Sviluppato da Arc Institute insieme a Nvidia, Stanford e Università della California, è stato addestrato su 9 mila miliardi di nucleotidi provenienti da 128mila genomi di specie diverse.
    Evo2 è in grado di analizzare sequenze genetiche fino a un milione di nucleotidi e individuare mutazioni legate a malattie, raggiungendo oltre il 90% di accuratezza nello studio del gene BRCA1 associato al tumore al seno.
    Il sistema può accelerare la scoperta delle cause genetiche delle malattie e la progettazione di terapie geniche più mirate, riducendo tempi e costi della ricerca.
    Le sue capacità, però, sono state limitate per evitare usi rischiosi come la progettazione di organismi potenzialmente pericolosi.

    Link alla fonte:
    https://www.ansa.it/canale_scienza/notizie/biotech/2026/03/05/la-chatgpt-del-dna-per-trovare-mutazioni-pericolose-e-terapie-su-misura_7a357f4c-df7a-4fa6-abc3-151ba0dc9602.html

  • Tratta gli LLM come strumenti più competenti di te, e scoprirai nuove strategie per ottenere risultati migliori

    Oggi vi consiglio la lettura di un articolo pubblicato su XDA Developers che suggerisce come, per sfruttare davvero i modelli linguistici avanzati, sia utile trattarli come “sistemi più competenti dell’utente” in specifici compiti, fornendo di conseguenza istruzioni precise e strutturate invece di intavolare conversazioni informali.

    Poiché gli LLM operano tramite token e hanno limiti di contesto, in molti casi prompt brevi e diretti possono migliorare l’accuratezza delle risposte, ma l’articolo raccomanda anche di considerare la prima risposta come una bozza e di applicare un metodo “socratico” per verificare e migliorare progressivamente l’output (e qui al caro Gianluigi Bonanomi fischieranno le orecchie).

    Per ridurre le allucinazioni e aumentare la qualità dei risultati è sempre utile, inoltre, integrare fonti esterne tramite tecniche come Retrieval-Augmented Generation (RAG, fondamentale per esempio in NotebookLM) oppure server MCP che colleghi ad applicazioni e fonti esterne, fornendo soprattutto al modello documentazione aggiornata e contesto rilevante.

    Infine, definire chiaramente ruolo del modello e formato dell’output (ad esempio JSON o Markdown) permette di ottenere risposte più strutturate e facilmente automatizzabili.

    Link alla fonte:

    https://www.xda-developers.com/start-treating-your-llms-as-smarter-than-you-because-they-are

  • I modelli di AI affrontano “Humanity’s Last Exam” per misurare la distanza dalla AGI

    I principali modelli di intelligenza artificiale — ChatGPT, Gemini, Claude e DeepSeek — sono stati sottoposti a Humanity’s Last Exam, un benchmark estremo progettato per valutare quanto siano vicini al livello di conoscenza degli esperti umani.
    Il test, pubblicato sulla rivista Nature e sviluppato dal Center for AI Safety insieme a Scale AI, comprende 2.500 domande di livello dottorale distribuite su oltre 100 discipline.
    A febbraio 2026 il miglior risultato è stato ottenuto da Gemini 3 Deep Think con il 48,4%, ancora distante dal circa 90% raggiunto dagli esperti umani nei rispettivi campi.
    I ricercatori sottolineano che, nonostante i rapidi progressi, superare questo benchmark non equivarrebbe automaticamente a raggiungere l’intelligenza artificiale generale (AGI).
    Lo studio riaccende quindi il dibattito su quanto tempo manchi davvero prima che l’IA raggiunga capacità paragonabili a quelle umane nella ricerca e nel ragionamento avanzato.

    Link alla fonte:
    https://www.elconfidencial.com/tecnologia/2026-03-05/ia-ultimo-examen-humanidad-agi-1qrt_4313376/