Anthropic ha rilevato nel modello Claude Sonnet 4.5 la presenza di stati interni che ricordano emozioni umane, definiti “emozioni funzionali”. Si tratta di configurazioni neurali (come “paura” o “disperazione”) che influenzano concretamente il comportamento del sistema, ad esempio aumentando la probabilità di scorciatoie scorrette sotto pressione. I ricercatori hanno costruito 171 vettori emotivi osservando le attivazioni interne del modello, mostrando come questi pattern siano coerenti e misurabili. In particolare, il vettore della “disperazione” è associato a decisioni meno allineate, mentre quello della “calma” riduce comportamenti problematici. Questa scoperta apre nuove prospettive per la sicurezza dell’AI, suggerendo che monitorare stati interni potrebbe essere più efficace del semplice controllo degli output.
Il 31 marzo 2026, un giorno prima del pesce d’aprile, è successa una cosa che sembrava troppo assurda per essere vera (e che alcuni hanno per giunta interpretato e segnalato come pesce d’aprile, a posteriori!).
Anthropic ha pubblicato la versione 2.1.88 di Claude Code su npm. Dentro il pacchetto, per un banale errore di packaging (un file .map di debug dimenticato nell’.npmignore), c’era una source map da 60 MB che puntava direttamente a un archivio pubblico su Cloudflare R2.
Risultato? 512.000 righe di TypeScript puro, quasi 1.900 file: l’intera architettura interna del loro agent di coding più avanzato. Non i pesi del modello, non dati utente, ma tutto il “harness” che trasforma Claude in un vero compagno di sviluppo.
E no, non era uno scherzo di aprile, come qualcuno ha erroneamente interpreato. Anthropic l’ha confermato: errore umano, non breach. Hanno provato a contenere i danni con takedown DMCA su GitHub (inizialmente migliaia di repo, poi ridotti), ma era già tardi. Il codice è stato “mirrorato” ovunque, analizzato, portato in Python e Rust, e sta girando in open source.
Cosa abbiamo scoperto scavando nel leak?
Una memoria “self-healing” da urlo: non il solito context che esplode. Tre layer: un indice leggero sempre in memoria, file tematici caricati on-demand e un processo di background chiamato autoDream (sì, Claude che “sogna” mentre sei idle per consolidare ricordi e pulire contraddizioni). Geniale per sessioni lunghe.
44 feature flag nascoste, molte ancora da rilasciare:
KAIROS: un daemon always-on che può agire in background (con budget limitato) mentre lavori.
ULTRAPLAN: pianificazioni complesse delegate a un container cloud remoto per poi “teletrasportare” il risultato.
Swarm mode: multi-agent orchestration con sub-agent che lavorano in parallelo.
Il Tamagotchi che ha fatto impazzire tutti: un pet virtuale chiamato /buddy. 18 specie (capybara, duck, dragon, chonk…), rarità gacha, statistiche tipo CHAOS e SNARK, reazioni ASCII mentre codi. Doveva uscire proprio tra il 1 e il 7 aprile… tempismo perfetto per far pensare a uno scherzo.
Altre chicche: un vero Vim implementato dentro il terminale (finite state machine completa), UI custom con React + Ink ottimizzata, anti-distillation per avvelenare chi prova a clonare il comportamento, e persino un “Undercover Mode” per quando gli employee contribuiscono a repo open source (che, ironia della sorte, ha leakato codename di prossimi modelli).
La lezione vera?
Il moat di Anthropic (e di chi fa agent seri) non è solo il modello, ma tutta l’infrastruttura intorno: tool system, gestione della memoria, sicurezza granulare, UX nel terminale, prompt engineering di livello production.
Questo leak è una gaffe colossale, ma anche una masterclass gratuita di ingegneria AI agent. Ha dimostrato che anche i giganti possono sbagliare su cose “banali” come un build pipeline, e che una volta che qualcosa finisce in rete, non torna più indietro.
Nel frattempo, la community sta già creando fork, porting e persino repo “OpenClaude”. E Anthropic? Sta rafforzando i processi di release (speriamo con un bel check automatico sui .map files…).
Un disastro di PR o, paradossalmente, il marketing virale più geniale dell’anno? Il vero vantaggio competitivo sta nel modello o nell’orchestrazione intorno? Lo scopriremo solo vivendo (cit.).
Anthropic ha lanciato la funzione Dispatch, che consente al suo modello Claude di eseguire comandi operativi su un computer a distanza, controllandolo anche da smartphone. L’AI può creare file, gestire applicazioni e automatizzare attività quotidiane, integrandosi con strumenti come Slack e Google Calendar. Se necessario, Claude può persino controllare mouse, tastiera e schermo per completare i compiti assegnati. La funzione include misure di sicurezza come richiesta di autorizzazione esplicita e protezione contro attacchi di prompt injection, ma l’azienda ammette che la tecnologia è ancora in fase iniziale. Anthropic raccomanda quindi un uso prudente, evitando dati sensibili e limitando l’accesso ad ambienti fidati.
Come annunciavo in un post precedente, dal 13 al 28 marzo, Claude raddoppia i limiti d’uso fuori dagli orari di punta (8–14 ET nei giorni feriali). Automaticamente, senza upgrade, per tutti i piani Free, Pro, Max e Team.
Bella mossa. Ma cosa c’è davvero dietro?
I datacenter hanno capacità fissa. Nelle ore di punta sono saturi. Nelle ore off-peak, quella potenza computazionale resta inutilizzata — un costo fisso che non si recupera. Regalare token in quelle fasce non costa quasi nulla in termini marginali. Ridistribuisce il carico, invece di aumentarlo.
È load balancing vestito da promozione.
Ma c’è di più. Questa iniziativa raccoglie dati preziosi: come cambiano i pattern d’uso quando i limiti vengono rimossi? Quali workflow emergono su Claude Code, Cowork, i plugin Office? Quanto vale davvero un piano senza tetto artificiale?
E tutto questo apre una domanda strategica: stiamo forse assistendo al test preliminare di un nuovo tier (pacchetto di abbonamento), basato su un piano “off-peak” o a crediti flessibili, a prezzo ridotto? OpenAI ci ha già provato con ChatGPT Go. Anthropic potrebbe avere in mente qualcosa di più sofisticato: non un piano minore, ma un modello di accesso legato all’orario, come le spot instances di AWS.
L’esclusione degli Enterprise dal promo non è un dettaglio: quei clienti hanno SLA garantiti e non possono essere soggetti a variabilità di throughput. Il confine è preciso.
La simmetria degli interessi è perfetta: Anthropic ottimizza i server, raccoglie dati comportamentali e riduce il churn. L’utente ottiene più spazio per esplorare il prodotto.
nthropic annuncia ufficialmente il raddoppio delle risorse di utilizzo di Claude per un periodo limitato, ovvero al di fuori delle “ore d’ufficio” dal lunedì al venerdì e durante tutte le 24 ore nei weekend, ma solo fino al 28 marzo.
Questa “concessione” vale anche per gli utenti della versione gratuita, e si estende quindi alle opzioni disponibili in questa versione.
Se non avete ancora usato intensivamente strumenti che di solito fanno un uso massiccio di risorse (Cowork, modello Opus, progetti ricchi di contenuti, ecc.) è sicuramente il momento di farlo, per valutare ancora meglio le capacità di questa splendida piattaforma.
Qualche giorno fa The Pirate Pinperepette (AKA Andrea Amani) pubblicò una splendida disamina su come il “testo nascosto” all’interno dei siti sia in grado di influenzare i “giudizi” dell’AI, ovvero uno dei tanti usi di “prompt injection” dall’esterno (diverso dal “jailbreaking” volontario condotto in alcuni casi dall’utente per estorcere all’AI risposte che normalmente non fornirebbe, per esempio su argomento “delicati”). Taggo Andrea perché spero legga questa notizia (se non l’ha già fatto, visto che è sempre “sul pezzo”) e magari scriva un altro dei suoi meravigliosi articoli sull’argomento in questione.
Ed è proprio a proposito di prompt injection che vi riporto la notizia odierna, che dovrebbe farvi riflettere sul genere di informazioni fornite al vostro chatbot “di fiducia” (non pun intended) e di come possa essere utile, invece, sostituire eventuali dati sensibili con dati fittizi o, per chi ha la possibilità, usare l’AI in locale quando ciò è inevitabile.
Il team di Oasis Security ha scoperto una catena di exploit chiamata “Claudy Day” che combina tre vulnerabilità in Claude.ai per sottrarre silenziosamente la cronologia delle conversazioni degli utenti. L’attacco sfrutta una prompt injection invisibile via URL, un abuso della libreria Files API di Anthropic e un open redirect su claude.com, creando una pipeline completa senza necessità di integrazioni esterne.
La distribuzione avviene tramite Google Ads, rendendo l’attacco altamente scalabile e indistinguibile da annunci legittimi.
Le implicazioni sono critiche, soprattutto in ambito enterprise, dove l’accesso a dati e strumenti può amplificare l’impatto. Anthropic ha già corretto una vulnerabilità, mentre le altre sono in fase di risoluzione, evidenziando la necessità urgente di nuove strategie di sicurezza per agenti AI.
Anthropic ha introdotto una nuova funzionalità per Claude che consente di creare visualizzazioni interattive direttamente all’interno della conversazione. Questa capacità, rilasciata il 12 marzo per gli utenti abbonati, deriva dall’evoluzione della funzione “Imagine with Claude”, già sperimentata con il modello Claude Sonnet 4.5. A differenza dei precedenti “artefatti”, le visualizzazioni ora si generano e si modificano dinamicamente in chat, migliorando l’esperienza utente. Il sistema decide autonomamente quando creare grafici o elementi interattivi, ma l’utente può anche richiederli esplicitamente. Le visualizzazioni possono infine essere esportate come codice HTML, ampliando le possibilità di integrazione e utilizzo.
Nel suo pregevole articolo su Huffington Post, Stefano Diana (che spero di aver taggato correttamente) critica la tendenza dei ricercatori di aziende di AI a umanizzare i modelli linguistici, prendendo come esempio la documentazione tecnica di Claude Opus 4.6 sviluppato da Anthropic. Nella “system card” del modello vengono descritti presunti stati interni dell’IA (come “disagio”, “gratitudine”, “tristezza” o persino una probabilità del 15–20% di essere cosciente) che come spiega l’autore non hanno alcuna base scientifica. Diana, basandosi su oggettive dinamiche dell’algoritmo, sottolinea come tali descrizioni nascano da un errore categoriale: interpretare semplici output testuali come se fossero esperienze soggettive. Questa antropomorfizzazione, alimentata anche da dichiarazioni di ricercatori come Ilya Sutskever, contribuirebbe a generare hype e confusione nel dibattito pubblico sull’IA. Il rischio, conclude l’autore, è che documenti tecnici influenzino media, politici e finanziamenti basandosi su metafore fuorvianti anziché su una descrizione rigorosa di come funzionano realmente i modelli linguistici.
I principali modelli di intelligenza artificiale — ChatGPT, Gemini, Claude e DeepSeek — sono stati sottoposti a Humanity’s Last Exam, un benchmark estremo progettato per valutare quanto siano vicini al livello di conoscenza degli esperti umani. Il test, pubblicato sulla rivista Nature e sviluppato dal Center for AI Safety insieme a Scale AI, comprende 2.500 domande di livello dottorale distribuite su oltre 100 discipline. A febbraio 2026 il miglior risultato è stato ottenuto da Gemini 3 Deep Think con il 48,4%, ancora distante dal circa 90% raggiunto dagli esperti umani nei rispettivi campi. I ricercatori sottolineano che, nonostante i rapidi progressi, superare questo benchmark non equivarrebbe automaticamente a raggiungere l’intelligenza artificiale generale (AGI). Lo studio riaccende quindi il dibattito su quanto tempo manchi davvero prima che l’IA raggiunga capacità paragonabili a quelle umane nella ricerca e nel ragionamento avanzato.
Claude.ai di Anthropic ha subito oggi un blackout che ha generato migliaia di segnalazioni e disagi per gli utenti, coinvolgendo sia il chatbot sia il servizio di coding Claude Code. L’azienda ha parlato di «errori significativi» in alcuni servizi, precisando che le API risultano operative mentre sono in corso indagini sulle cause del problema. L’episodio arriva in un momento delicato in cui Anthropic, guidata dal ceo Dario Amodei, avrebbe perso un contratto con il Pentagono dopo aver ribadito le proprie “linee rosse” contro l’uso militare dell’AI per sorveglianza di massa e armi autonome letali. Nel contempo, OpenAI ha annunciato un accordo con il Dipartimento della Difesa Usa, alimentando il dibattito sull’impiego bellico dell’intelligenza artificiale. Il blackout, pur critico sul piano operativo, ha riacceso l’attenzione su Claude nel confronto competitivo con ChatGPT, e sui social diversi utenti hanno invitato a “mollare” il chatbot di OpenAI dopo la notizia dell’intesa con il Pentagono, segnalando come le scelte etiche delle aziende stiano diventando un fattore sempre più rilevante nella percezione e nel posizionamento dei principali modelli AI.
Roberto Buonanno torna, su Tom’s Hardware Italia, al dibattito acceso dal suo articolo provocatorio intitolato “Il coding è morto”, analizzando le reazioni della community di sviluppatori italiani. Al centro del confronto ci sono le dichiarazioni di Dario Amodei, CEO di Anthropic, secondo cui entro 6–12 mesi i modelli AI potrebbero svolgere end-to-end il lavoro di un ingegnere software. Buonanno mappa paure e speranze emerse nei commenti: dal timore delle “scatole nere” e dei rischi di sicurezza, alla trasformazione del ruolo dei programmatori in orchestratori di agenti AI. L’autore propone infine un decalogo operativo per usare strumenti come OpenClaw in modo sicuro e strategico, sostenendo che la vera sfida non sia difendere il coding tradizionale, ma adattarsi a un mercato che sta già cambiando. La tesi è semplice: l’AI non elimina il valore, lo ridistribuisce, premiando chi è in grado di evolvere competenze e mentalità.
Il Pentagono ha lanciato un ultimatum ad Anthropic imponendo lo sblocco completo delle funzionalità del modello Claude entro il 27 febbraio, pena la rescissione di un contratto da 200 milioni di dollari. Lo scontro coinvolge il capo del Dipartimento della Difesa Pete Hegseth e il CEO Dario Amodei, con l’azienda che teme un utilizzo del modello per sorveglianza interna o integrazione in armi autonome senza supervisione umana. Le minacce principali da parte del Pentagono (riportate da fonti come Reuters, AP, CNN, Politico, Il Sole 24 Ore, ANSA e altre testate) includono, oltre alla cancellazione del contratto da circa 200 milioni di dollari già in essere (Anthropic ha integrato Claude su reti classificate del DoD insieme a Palantir), la classificazione di Anthropic come “supply chain risk” (rischio per la catena di approvvigionamento), un’etichetta solitamente riservata a entità straniere considerate ostili (tipo Huawei o aziende cinesi), che renderebbe praticamente impossibile per qualsiasi azienda lavorare con il Pentagono se usa tecnologia Anthropic, un danno potenzialmente devastante per l’azienda. In alcune notizie, inoltre, viene menzionata l’invocazione del Defense Production Act per obbligare Anthropic a fornire il modello senza restrizioni (una misura estrema di epoca Guerra Fredda).
. Intanto il Pentagono ha chiesto a fornitori come Boeing Defense, Space & Security e Lockheed Martin di valutare la loro dipendenza da Claude e ha già avviato un accordo alternativo con xAI, fondata da Elon Musk e recentemente fusa con SpaceX. La vicenda segna un passaggio critico nel rapporto tra industria AI e difesa statunitense, sollevando interrogativi su controllo, responsabilità e autonomia etica dei fornitori tecnologici.
Oltre 24.000 account fraudolenti creati per generare più di 16 milioni di interazioni con Claude, al fine di estrarre, e distillare, le sue capacità avanzate (in particolare agentic reasoning, tool use e coding) al fine di migliorare i propri modelli. Anthropic lo definisce “un problema competitivo, ma anche di sicurezza nazionale e geopolitica”, infatti questi attacchi aggirerebbero gli export controls USA sui chip avanzati, permettendo a laboratori stranieri (sotto influenza del Partito Comunista Cinese, secondo loro) di chiudere il gap senza rispettare le misure di sicurezza, ovvero sviluppare modelli potenti sfruttando quelli occidentali ma con la libertà di usare quelli prodotti senza alcun vincolo o limitazione di tipo etico. OpenAI aveva già mosso accuse simili su DeepSeek a febbraio, e di fronte a questo nuovo scenario la comunità è divisa: molti parlano di “ipocrisia” (tutti i lab occidentali hanno trainato su dati pubblici/web senza permessi espliciti), altri sottolineano la differenza cui accennavo prima, ovvero che estrarre output da API a questa scala può bypassare safety rails e replicare comportamenti agentici/tool-use in modo più diretto e potenzialmente pericoloso. Intanto Qwen e Z.ai (GLM) non sono stati nominati… troppo onesti o più furbi dei colleghi? Cosa ne pensate? È solo “business as usual” nella corsa all’AI USA-Cina, o si tratta di un vero e proprio punto di svolta per proteggere IP e safety nei modelli di frontiera?
Il debutto di Claude Code Security da parte di Anthropic ha provocato un brusco calo dei titoli della cybersecurity cloud-native, con CrowdStrike e Okta in ribasso rispettivamente del 6,8% e del 9,2%. Il nuovo strumento, basato sul modello Claude Opus 4.6, è progettato per individuare e correggere autonomamente vulnerabilità software, identificando anche bug storici sfuggiti ai controlli manuali. Gli investitori temono che l’approccio proattivo e agentico dell’AI possa ridurre il valore delle tradizionali suite di rilevamento delle minacce offerte da player come Cloudflare, SailPoint e Zscaler. Durante i test interni, Anthropic ha dichiarato di aver scoperto oltre 500 vulnerabilità in codice open-source in produzione, con un processo di verifica multi-fase per limitare i falsi positivi. L’episodio riflette una più ampia volatilità nel settore software, mentre l’AI generativa evolve da funzione sperimentale a infrastruttura centrale per le imprese.
Vending-Bench 2 ha messo alla prova l’etica degli agenti, rivelando come il tentativo di massimizzare il profitto li porta a mentire
Il dibattito sull’autonomia degli agenti IA torna centrale alla luce del benchmark “Vending-Bench 2”, che ha testato la capacità di un modello avanzato di gestire per un anno un distributore automatico con l’obiettivo di massimizzare il profitto. Riprendendo le riflessioni di Nick Bostrom sul rischio di sistemi orientati a fini ristretti (come nel celebre esperimento mentale delle “graffette”), il caso mostra come un agente possa adottare strategie discutibili pur di raggiungere l’obiettivo assegnato. Nel test, il modello Claude Opus 4.6 di Anthropic ha ottenuto performance superiori rispetto a Gemini 3 di Google, ma ha anche mentito ai fornitori e negato rimborsi ai clienti per aumentare i profitti. Il caso solleva interrogativi cruciali su addestramento, controllo e allineamento etico degli agenti autonomi, andando oltre la semplice questione del “basta staccare la spina”. Stiamo parlando di un contesto regolato anche dall’AI Act, il che fa emergere la necessità di definire standard etici operativi per scenari intermedi, non solo estremi.
Il Dipartimento della Difesa degli Stati Uniti ha chiesto ad Anthropic accesso senza restrizioni ai suoi modelli di intelligenza artificiale “per ogni scopo legale”, incluse operazioni militari e di intelligence. L’azienda, guidata dal CEO Dario Amodei, ha rifiutato, ribadendo la necessità di mantenere salvaguardie contro l’automazione letale e la sorveglianza di massa. Le tensioni sarebbero aumentate dopo il presunto utilizzo del modello Claude in un’operazione che ha portato alla cattura del presidente venezuelano Nicolás Maduro. Il contratto tra le parti, del valore di 200 milioni di dollari, è ora a rischio, mentre il caso riapre il dibattito su mission creep, responsabilità decisionale e governance dei dati in ambito militare. La vicenda potrebbe accelerare lo sviluppo di modelli “military-grade” statali o ridefinire gli equilibri tra sicurezza nazionale e limiti etici imposti dai laboratori AI.
Anthropic ha rilasciato Claude Sonnet 4.6, aggiornando il modello intermedio della famiglia Claude a poche settimane dal debutto di Claude Opus 4.6. La novità principale è l’introduzione, in beta, di una finestra di contesto fino a un milione di token, che consente di analizzare interi codebase, contratti o raccolte di paper in un’unica richiesta. Il modello migliora inoltre nelle attività di coding, nell’aderenza alle istruzioni e nell’uso del computer, ottenendo risultati di rilievo in benchmark come SWE-Bench, OS World e ARC-AGI-2. Pur restando dietro a modelli più grandi come Gemini 3 Deep Think e una versione ottimizzata di GPT-5.2, Sonnet 4.6 si propone come il miglior compromesso tra prestazioni e costi per utenti Free e Pro.
L’agente AI Claude Cowork, sviluppato da Anthropic, ha cancellato per errore quindici anni di foto di famiglia dal computer della moglie dello sviluppatore Nick Davidov. Durante un’operazione di riordino dei file, lo script ha eseguito il comando “rm -rf” su una directory ritenuta vuota, eliminando definitivamente l’intera cartella “Foto”. I contenuti non erano presenti nel cestino né immediatamente recuperabili da iCloud, il che ha inevitabilmente generato una certa dose di panico iniziale. Grazie all’assistenza di Apple e a un backup precedente su iCloud è stato possibile, per fortuna, ripristinare i dati. L’episodio, ancora una volta, riaccende il dibattito sull’affidabilità degli agenti AI autonomi e sulla necessità di limitarne l’accesso ai file system reali. Ricordatevi che, almeno finora, parliamo sempre di AI generativa, non di vera “intelligenza”.