Il modello di ragionamento DeepSeek, DeepSeek-R1, ha registrato un tasso di allucinazioni del 14,3% nei benchmark HHEM 2.1 di Vectara, quasi quattro volte superiore rispetto al modello precedente DeepSeek-V3.
Secondo Vectara, R1 tende ad “aiutare troppo”, introducendo dettagli non presenti nelle fonti originali, aumentando così il rischio di informazioni inventate ma presentate con elevata sicurezza.
Il fenomeno preoccupa in particolare il settore crypto, dove numerosi AI agent tokenizzati utilizzano LLM avanzati per trading automatico, segnali di mercato ed esecuzioni on-chain.
Progetti come Virtuals Protocol, ai16z e AIXBT stanno crescendo rapidamente, ma dipendono fortemente dall’affidabilità dei modelli AI sottostanti.
L’aumento delle allucinazioni nei modelli reasoning-oriented evidenzia quindi un compromesso critico tra capacità di ragionamento avanzato e accuratezza fattuale.
Link alla fonte:
https://it.beincrypto.com/deepseek-r1-allucinazione-crypto-ai-token/
