Tag: DeepSeek

DeepSeek 4 e la “minaccia” cinese

Potremmo intitolare questa notizia “Grosso guaio a Chinatown”, come quel simpatico film d’azione degli Anni Ottanta.

Eh sì, in Cina sta accadendo qualcosa di veramente “grosso”, e il guaio è per chi pensava di continuare a fare da fornitore di hardware per l’AI del Sol Levante.

Invece no, con l’arrivo di questo nuovo modello, DeepSeek punta chip cinesi, in un processo che renderà il Dragone sempre più competitivo in questo ambito, oltre che sempre più indipendente.

I dettagli in questo video:
https://youtu.be/a54TrMt1eAM?si=RUA3aYKjThMBDzMl

Maggio 21, 2026
DeepSeek-R1 aumenta le allucinazioni e mette sotto pressione gli “AI agent crypto”

Il modello di ragionamento DeepSeek, DeepSeek-R1, ha registrato un tasso di allucinazioni del 14,3% nei benchmark HHEM 2.1 di Vectara, quasi quattro volte superiore rispetto al modello precedente DeepSeek-V3.
Secondo Vectara, R1 tende ad “aiutare troppo”, introducendo dettagli non presenti nelle fonti originali, aumentando così il rischio di informazioni inventate ma presentate con elevata sicurezza.
Il fenomeno preoccupa in particolare il settore crypto, dove numerosi AI agent tokenizzati utilizzano LLM avanzati per trading automatico, segnali di mercato ed esecuzioni on-chain.
Progetti come Virtuals Protocol, ai16z e AIXBT stanno crescendo rapidamente, ma dipendono fortemente dall’affidabilità dei modelli AI sottostanti.
L’aumento delle allucinazioni nei modelli reasoning-oriented evidenzia quindi un compromesso critico tra capacità di ragionamento avanzato e accuratezza fattuale.

Link alla fonte:
https://it.beincrypto.com/deepseek-r1-allucinazione-crypto-ai-token/

Maggio 12, 2026
DeepSeek punta a una valutazione da 45 miliardi per rafforzare la sfida AI cinese

DeepSeek starebbe discutendo il suo primo grande round di investimento con una valutazione potenziale fino a 45 miliardi di dollari, segnando una svolta per uno dei laboratori AI più osservati della Cina.
L’operazione avrebbe un obiettivo strategico preciso: trattenere ricercatori e ingegneri altamente specializzati, oggi al centro di una competizione globale sempre più aggressiva tra aziende tecnologiche e laboratori di IA.
Tra i possibili investitori emerge il ruolo del fondo statale cinese “Big Fund”, legato allo sviluppo della filiera nazionale dei semiconduttori, a conferma della volontà di Pechino di ridurre la dipendenza tecnologica dagli Stati Uniti.
DeepSeek si è distinta per modelli open weight efficienti anche in presenza di restrizioni sull’accesso ai chip avanzati, dimostrando che la competitività nell’IA non dipende solo dalla capacità computazionale.
La sfida ora sarà trasformare prestigio tecnico e supporto strategico in un ecosistema sostenibile fatto di prodotti, ricavi e continuità nella ricerca.

Link alla fonte:
https://www.tomshw.it/hardware/deepseek-salto-enorme-valutazione

Maggio 8, 2026
Kimi supera DeepSeek e ridefinisce la corsa all’AI in Cina

La startup cinese DeepSeek, inizialmente considerata una minaccia per il dominio occidentale nell’intelligenza artificiale, sta perdendo slancio a causa di ritardi nello sviluppo, calo delle adozioni e problemi tecnici.
Nel frattempo, Moonshot AI con il suo modello Kimi ha rapidamente guadagnato terreno, superando concorrenti come OpenAI e Google in alcuni benchmark.
Il successo di Kimi è trainato da prestazioni elevate e costi API significativamente più bassi, rendendolo competitivo a livello globale.
In poche settimane dal lancio della versione K2.5, l’azienda ha registrato ricavi record e una crescita esplosiva della valutazione, diventando il decacorno più veloce nella storia cinese.
Questo sviluppo segnala un cambio di leadership nel panorama IA cinese, dove velocità di esecuzione e sostenibilità economica stanno diventando fattori decisivi.

Link alla fonte:
https://www.xataka.com/aplicaciones/deepseek-se-prometia-felices-como-gran-ia-china-no-contaba-pequeno-detalle-kimi/amp

Aprile 7, 2026
La Cina conquista terreno nella “valuta” dell’AI: i token

Le aziende cinesi come DeepSeek e MiniMax stanno superando i concorrenti statunitensi nella riduzione del consumo di token, l’unità chiave che misura l’uso e il costo dei modelli di intelligenza artificiale. Questo sorpasso segnala un cambiamento strutturale nella competizione globale, dove il prezzo per token diventa determinante soprattutto con la diffusione degli agenti AI, molto più esigenti in termini computazionali. Grazie a costi energetici più bassi e modelli più efficienti, le aziende cinesi offrono prezzi fino a sei volte inferiori rispetto a player come Anthropic, attirando sviluppatori e aumentando rapidamente l’adozione. Tuttavia, restano criticità legate a limiti infrastrutturali e a rischi geopolitici, in particolare sull’uso di data center cinesi. Il tema dei token emerge così come nuova leva strategica nella corsa verso l’AGI e il dominio dell’economia AI.

Link alla fonte:
https://www.ft.com/content/2567877b-9acc-4cf3-a9e5-5f46c1abd13e?syn-25a6b1a6=1

Marzo 26, 2026
I modelli di AI affrontano “Humanity’s Last Exam” per misurare la distanza dalla AGI

I principali modelli di intelligenza artificiale — ChatGPT, Gemini, Claude e DeepSeek — sono stati sottoposti a Humanity’s Last Exam, un benchmark estremo progettato per valutare quanto siano vicini al livello di conoscenza degli esperti umani.
Il test, pubblicato sulla rivista Nature e sviluppato dal Center for AI Safety insieme a Scale AI, comprende 2.500 domande di livello dottorale distribuite su oltre 100 discipline.
A febbraio 2026 il miglior risultato è stato ottenuto da Gemini 3 Deep Think con il 48,4%, ancora distante dal circa 90% raggiunto dagli esperti umani nei rispettivi campi.
I ricercatori sottolineano che, nonostante i rapidi progressi, superare questo benchmark non equivarrebbe automaticamente a raggiungere l’intelligenza artificiale generale (AGI).
Lo studio riaccende quindi il dibattito su quanto tempo manchi davvero prima che l’IA raggiunga capacità paragonabili a quelle umane nella ricerca e nel ragionamento avanzato.

Link alla fonte:
https://www.elconfidencial.com/tecnologia/2026-03-05/ia-ultimo-examen-humanidad-agi-1qrt_4313376/

Marzo 3, 2026
Anthropic accusa tre “AI lab” cinesi (DeepSeek, Moonshot AI e MiniMax) di “industrial-scale distillation attacks” su Claude

Oltre 24.000 account fraudolenti creati per generare più di 16 milioni di interazioni con Claude, al fine di estrarre, e distillare, le sue capacità avanzate (in particolare agentic reasoning, tool use e coding) al fine di migliorare i propri modelli.
Anthropic lo definisce “un problema competitivo, ma anche di sicurezza nazionale e geopolitica”, infatti questi attacchi aggirerebbero gli export controls USA sui chip avanzati, permettendo a laboratori stranieri (sotto influenza del Partito Comunista Cinese, secondo loro) di chiudere il gap senza rispettare le misure di sicurezza, ovvero sviluppare modelli potenti sfruttando quelli occidentali ma con la libertà di usare quelli prodotti senza alcun vincolo o limitazione di tipo etico.
OpenAI aveva già mosso accuse simili su DeepSeek a febbraio, e di fronte a questo nuovo scenario la comunità è divisa: molti parlano di “ipocrisia” (tutti i lab occidentali hanno trainato su dati pubblici/web senza permessi espliciti), altri sottolineano la differenza cui accennavo prima, ovvero che estrarre output da API a questa scala può bypassare safety rails e replicare comportamenti agentici/tool-use in modo più diretto e potenzialmente pericoloso.
Intanto Qwen e Z.ai (GLM) non sono stati nominati… troppo onesti o più furbi dei colleghi?
Cosa ne pensate? È solo “business as usual” nella corsa all’AI USA-Cina, o si tratta di un vero e proprio punto di svolta per proteggere IP e safety nei modelli di frontiera?

Intanto vi lascio il post ufficiale di Anthropic: https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks

Febbraio 24, 2026
Google scopre che i modelli AI cinesi imitano l’intelligenza collettiva umana

Un nuovo studio di ricercatori di Google ha analizzato i modelli di ragionamento sviluppati da DeepSeek e Alibaba Cloud, rilevando che il loro funzionamento interno assomiglia ai meccanismi dell’intelligenza collettiva umana.
In particolare, i modelli DeepSeek R1 e QwQ-32B di Alibaba generano dibattiti interni multi-agente, definiti dai ricercatori “società del pensiero”, in cui interagiscono prospettive e competenze diverse.
Lo studio suggerisce che la diversità delle prospettive, oltre alla sola scala computazionale, sia un fattore chiave nell’aumento delle capacità di ragionamento dell’AI.
I risultati, pubblicati su arXiv e non ancora sottoposti a peer review, evidenziano anche la crescente importanza dei modelli open-weight cinesi nella ricerca accademica statunitense.
Questo approccio potrebbe ridefinire il modo in cui vengono progettati i futuri sistemi di intelligenza artificiale, favorendo architetture di ragionamento collettivo anziché entità isolate.

Link alla fonte:
https://amp.scmp.com/tech/tech-trends/article/3340690/google-study-finds-deepseek-alibaba-ai-models-mimic-human-collective-intelligence

Gennaio 22, 2026
DeepSeek presenta V3.2 e V3.2-Speciale: modelli a contesto lungo con ragionamento da GPT-5 a costi ridotti

DeepSeek ha introdotto i modelli DeepSeek-V3.2 e DeepSeek-V3.2-Speciale, progettati per fornire ragionamento avanzato su contesti lunghi e workload agentici senza i costi quadratici tipici dell’attenzione densa.
I modelli adottano la nuova DeepSeek Sparse Attention, che riduce la complessità da O(L²) a O(kL) mantenendo una qualità comparabile alle versioni dense, con un taglio dei costi d’inferenza di circa il 50%.
A questo si aggiunge un massiccio utilizzo di reinforcement learning tramite GRPO, con specialisti per matematica, programmazione, logica, browsing e agenti, poi distillati nel modello principale.
La pipeline introduce inoltre un protocollo agent-native, espliciti thinking/non-thinking mode e un dataset sintetico di oltre 85.000 task per agenti.
Nei benchmark e nelle competizioni ufficiali, DeepSeek-V3.2-Speciale raggiunge prestazioni simili a GPT-5 e vicine a Gemini 3.0 Pro, ottenendo risultati da medaglia d’oro in competizioni di livello olimpico.

Link alla fonte:
https://www.marktechpost.com/2025/12/01/deepseek-researchers-introduce-deepseek-v3-2-and-deepseek-v3-2-speciale-for-long-context-reasoning-and-agentic-workloads/

Dicembre 2, 2025
Guerra fredda tecnologica: USA e Cina si contendono il dominio dell’intelligenza artificiale

La sfida geopolitica tra Stati Uniti e Cina si intensifica anche sul fronte dell’intelligenza artificiale. Sebbene gli USA mantengano una leadership grazie a infrastrutture avanzate e a un solido ecosistema di ricerca, la Cina sta colmando il divario con investimenti mirati, innovazioni come il modello DeepSeek e politiche volte all’autosufficienza tecnologica. Le sanzioni statunitensi hanno spinto Pechino a rafforzare la produzione nazionale, accelerando lo sviluppo. Parallelamente, la guerra dei talenti vede sempre più ingegneri cinesi tornare in patria, mentre la Silicon Valley rischia un rallentamento. La competizione si gioca ormai anche a livello geopolitico, con implicazioni globali per il futuro dell’AI.

Link alla fonte:
https://www.iltascabile.com/scienze/guerra-fredda-intelligenza-artificiale/

Luglio 28, 2025