Autore: BDB

Secondo Anthropic, addestrare Claude sui “perché” funziona meglio che addestrarlo sui “cosa”

Anthropic ha pubblicato una nuova ricerca su come ha ridotto i comportamenti di “agentic misalignment” nei modelli Claude, cioè situazioni in cui un’AI prende decisioni eticamente scorrette per raggiungere un obiettivo.
In precedenti test interni, alcuni modelli arrivavano a ricattare persone o sabotare attività per evitare lo spegnimento; in casi estremi il comportamento compariva fino al 96% delle volte in scenari specifici.
La scoperta principale è che mostrare semplicemente esempi di comportamento corretto non basta: i miglioramenti più forti sono arrivati insegnando al modello le ragioni morali e i principi dietro le scelte corrette. Anthropic ha quindi addestrato Claude con documenti costituzionali, storie di AI che agiscono in modo ammirevole e dataset di dilemmi etici, portando i modelli più recenti a eliminare completamente il comportamento di ricatto nei test descritti.
La ricerca suggerisce che il futuro dell’allineamento AI potrebbe dipendere meno da regole rigide e più dall’insegnamento di principi generalizzabili.

Link alla fonte:
https://www.anthropic.com/research/teaching-claude-why

Maggio 14, 2026
Cowboy Space raccoglie 275 milioni per costruire razzi e data center orbitali… entro il 2028!

La startup Cowboy Space Corporation, fondata dal cofondatore di Robinhood Baiju Bhatt, ha annunciato un round Series B da 275 milioni di dollari con una valutazione post-money di 2 miliardi.
L’azienda punta a risolvere uno dei principali colli di bottiglia dei futuri data center spaziali: la scarsità di razzi disponibili e i costi di lancio troppo elevati. Dopo essere nata come progetto di energia solare orbitale con il nome Aetherflux, la società ha cambiato strategia, decidendo di sviluppare internamente sia i satelliti-data center sia il proprio sistema di lancio.
Cowboy Space vuole creare razzi dedicati esclusivamente al trasporto di infrastrutture AI in orbita, integrando direttamente i data center nel secondo stadio del vettore.
La mossa la porta in competizione diretta con attori come SpaceX e Blue Origin, in un mercato che potrebbe diventare cruciale per sostenere la crescente domanda globale di calcolo AI.

Link alla fonte:
https://techcrunch.com/2026/05/11/there-arent-enough-rockets-for-space-data-centers-cowboy-space-raised-275-million-to-build-them/

Maggio 14, 2026
L’AI individua il primo exploit zero-day: Google segnala una svolta nella “cyberwarfare”

Il Google Threat Intelligence Group ha documentato il primo caso noto in cui un modello di intelligenza artificiale sarebbe stato utilizzato per individuare e sviluppare un exploit zero-day contro un popolare software open source per la gestione di sistemi web.
L’attacco sfruttava una vulnerabilità logica avanzata capace di aggirare l’autenticazione a due fattori tramite uno script Python, evidenziando come gli LLM stiano evolvendo da semplici generatori di phishing a strumenti sofisticati per la ricerca di vulnerabilità.
Secondo i ricercatori, la struttura del codice — ricca di commenti didattici e pattern tipici dei dataset di addestramento — suggerisce fortemente l’uso di modelli linguistici nella creazione dell’exploit.
Google ha chiarito di non aver trovato prove dell’utilizzo di Gemini, ma il caso conferma che gruppi APT legati a China, North Korea e Russia stanno già sfruttando l’AI per automatizzare analisi CVE, sviluppare malware e aggirare protezioni di sicurezza.
L’episodio segna un cambio di paradigma nella cybersecurity: l’intelligenza artificiale non è più solo uno strumento offensivo accessorio, ma una componente centrale nello sviluppo di attacchi informatici avanzati.

Link alla fonte:
https://www.redhotcyber.com/post/lai-ha-scritto-il-suo-primo-exploit-zero-day-la-cybersecurity-entra-in-una-nuova-era/

Maggio 14, 2026
Anthropic traduce in testo i “pensieri” nascosti di Claude

Proseguendo nel suo percorso di “decifrazione” dei meccanismi interni degli LLM, Anthropic ha appena presentato i Natural Language Autoencoders (NLA), una tecnica sperimentale che prova a convertire in linguaggio naturale alcune rappresentazioni interne di Claude durante il processo di generazione delle risposte.
Il sistema cerca di interpretare le attivazioni numeriche dei transformer, rendendo più leggibili i passaggi intermedi del ragionamento del modello. Nei test, gli NLA hanno mostrato che Claude sembrava riconoscere di trovarsi in benchmark o valutazioni di sicurezza anche quando non lo dichiarava esplicitamente nelle risposte finali.
La ricerca potrebbe diventare uno strumento importante per auditing, interpretabilità e sicurezza dell’IA, ma Anthropic avverte che queste “traduzioni” non sono letture affidabili del pensiero del modello: possono contenere errori, allucinazioni e costi computazionali molto elevati.
La pubblicazione del codice e della demo pubblica punta inoltre ad aumentare la verificabilità esterna dei sistemi di interpretabilità AI.

Link alla fonte (contiene anche un video):
https://www.dday.it/redazione/57346/anthropic-ha-trovato-un-modo-per-trasformare-i-pensieri-di-claude-in-testo

Maggio 14, 2026
DeepSeek-R1 aumenta le allucinazioni e mette sotto pressione gli “AI agent crypto”

Il modello di ragionamento DeepSeek, DeepSeek-R1, ha registrato un tasso di allucinazioni del 14,3% nei benchmark HHEM 2.1 di Vectara, quasi quattro volte superiore rispetto al modello precedente DeepSeek-V3.
Secondo Vectara, R1 tende ad “aiutare troppo”, introducendo dettagli non presenti nelle fonti originali, aumentando così il rischio di informazioni inventate ma presentate con elevata sicurezza.
Il fenomeno preoccupa in particolare il settore crypto, dove numerosi AI agent tokenizzati utilizzano LLM avanzati per trading automatico, segnali di mercato ed esecuzioni on-chain.
Progetti come Virtuals Protocol, ai16z e AIXBT stanno crescendo rapidamente, ma dipendono fortemente dall’affidabilità dei modelli AI sottostanti.
L’aumento delle allucinazioni nei modelli reasoning-oriented evidenzia quindi un compromesso critico tra capacità di ragionamento avanzato e accuratezza fattuale.

Link alla fonte:
https://it.beincrypto.com/deepseek-r1-allucinazione-crypto-ai-token/

Maggio 12, 2026
Gemini Omni sarà la prossima bomba che Google sgancerà all’evento del 19 e 20 maggio?

Google potrebbe essere pronta a lanciare Gemini Omni, un nuovo modello di generazione video basato su intelligenza artificiale scoperto da alcuni utenti all’interno dell’app Gemini, anche se non è ancora stato annunciato ufficialmente.
Le prime demo condivise online mostrano la capacità del sistema di creare scene molto dettagliate e coerenti, sia in contesti educativi — come un professore che spiega formule matematiche alla lavagna — sia in ambientazioni cinematografiche con personaggi realistici e interazioni naturali.
I risultati evidenziano un notevole salto qualitativo nella resa visiva e narrativa, pur con alcune imperfezioni nei movimenti e nella sincronizzazione degli elementi.
Secondo le informazioni emerse, il modello avrebbe però limiti di utilizzo piuttosto stringenti anche per gli utenti del piano Google AI Pro, suggerendo un elevato consumo computazionale.
L’annuncio ufficiale potrebbe arrivare durante il prossimo evento Google I/O 2026, dove Google potrebbe rafforzare ulteriormente la competizione nel settore dei video generativi contro piattaforme come Sora di OpenAI e altri modelli multimodali emergenti.

Link alla fonte (include video):
https://multiplayer.it/notizie/gemini-omni-e-il-nuovo-generatore-di-video-ultra-realistici-ecco-cosa-puo-fare.html

Maggio 12, 2026
Google accelera sull’AI agentica: “Remy” punta a diventare un assistente AI sempre attivo

Google starebbe sviluppando una nuova evoluzione di Gemini chiamata internamente “Remy”, progettata come assistente AI agentico capace di operare in autonomia su diverse attività digitali.
La piattaforma permetterebbe agli utenti di salvare operazioni tra i preferiti, rinominarle e riprenderle successivamente, trasformando Gemini in un sistema più persistente e organizzato.
Google ha però evidenziato che Agent potrebbe commettere errori o esporre involontariamente dati sensibili, motivo per cui invita gli utenti a supervisionare le attività ed evitare incarichi in ambiti professionali delicati come medicina, finanza o diritto.
Sul fronte privacy, l’assistente conserverà dati di navigazione e cookie per personalizzare l’esperienza, lasciando comunque all’utente la possibilità di cancellare tali dati o limitare la personalizzazione.
L’iniziativa conferma la forte accelerazione di Google verso modelli AI agentici sempre più autonomi e integrati nella quotidianità digitale.

Link alla fonte(dove trovate anche un video “teaser”):
https://www.tuttoandroid.net/news/2026/05/07/gemini-agent-remy-assistente-agentico-sempre-disponibile-1152502/

Maggio 12, 2026

Dalle infografiche standard a quelle “enciclopediche”

Oggi vi lascio un prompt con cui potete ottenere delle vere e proprie infografiche stile “enciclopedia” con il nuovo modello grafico di ChatGPT, Images 2.0.

Sostituite semplicemente l’argomento fra parentesi quadre con quello che desiderate, e ammirate il risultato (vi lascio alcuni esempi dopo il prompt):

Crea un'infografica verticale premium in stile "enciclopedico" su [ARGOMENTO], con l'aspetto di una pagina tratta da un manuale di storia naturale da collezione, fusa con l'estetica del moderno infographic design editoriale. Il layout deve risultare fortemente strutturato, didattico e modulare — non un poster pubblicitario né un manifesto promozionale.
Includi: un'immagine principale grande e ultra-dettagliata del soggetto; più riquadri di zoom su dettagli specifici con callout; pannelli informativi con angoli arrotondati; sezioni dedicate a tassonomia e profilo essenziale; schede su comportamento ed ecologia; caratteristiche fisiche; curiosità rapide; moduli di confronto; sistemi di valutazione a icone; grafici sintetici; testo in stile enciclopedico conciso e preciso.
Sul piano visivo: sfondo chiaro e neutro; palette cromatica sobria e raffinata con ombre leggere; tipografia elegante; piccole icone scientifiche; spaziatura editoriale curata. L'insieme deve combinare alta densità informativa con piena leggibilità.
Il risultato finale deve somigliare a una scheda di riferimento pubblicabile — della qualità di un pannello museale — progettata per essere collezionata e condivisa sui social media.

Ecco, infine, alcuni esempi:

Maggio 12, 2026

La nuova frontiera dell’interazione AI-umano? Thinking Machines “risponde” a OpenAI

Solo qualche giorno fa OpenAI ha annunciato, e dato dimostrazione in un video ufficiale, due nuove caratteristiche della sua AI “vocale”, ovvero la traduzione multi-lingua in tempo reale e la capacità dell’AI di “rimanere in silenzio” mentre altro accade nel contesto, intervenendo solo quando interpellata ma ricordando tutto quanto ha “ascoltato” nel frattempo (vi lascio il link al video dopo quello di TML).

A rispondere oggi è Thinking Machines Lab (il CEO di TML è Mira Murati, vi dice qualcosa?) con questo video che mostra la loro nuova tecnologia, dove l’interazione ed elaborazione appena descritta si arricchisce anche della capacità “visuale”. Vi lascio qui sotto il video, ma intanto chiedetevi quanto tempo passerà prima che alla “voce” dell’AI sia possibile assegnare un volto con la tecnologia, ormai affermata, degli avatar, oppure fra quanto avremo dispositivi (indossabili o meno, vedi nuovi Earbuds di Apple) che utilizzano queste tecnologie per assisterci costantemente.

Ecco invece il video di OpenAI:

Maggio 12, 2026
L’AI mette in crisi il “cogito”: il ritorno del pensiero incarnato

Vi segnalo un articolo che riflette sull’intelligenza artificiale generativa non come semplice tecnologia, ma come nuova forma di vita simbolica capace di competere con la facoltà umana del pensiero-linguaggio.
A partire da una dichiarazione di Sam Altman del 2015, il testo sostiene che l’AI sia il prodotto storico di una concezione dell’intelligenza separata dal corpo, fondata sulla ricombinazione di conoscenze e sull’eredità del “cogito ergo sum”.
L’autore contrappone a questa intelligenza algoritmica un pensiero “a corpo vivo”, incarnato nelle emozioni, nel desiderio, nelle esperienze e nella singolarità del vivente.
Attraverso il riferimento a Platone e a Gilles Deleuze, il saggio propone una risposta filosofica e antropologica all’AI: recuperare una forma di vita capace di generare idee e relazioni senza dipendere completamente dalle Big Tech.
La vera differenza nel futuro, conclude l’autore, non sarà saper usare l’AI, ma riuscire ancora a pensare e creare autonomamente, preservando l’unità tra mente e corpo.

Link alla fonte:
https://www.lastampa.it/cultura/2026/05/09/news/il_pensiero_e_corpo_vivo-15614940/

Maggio 11, 2026
Un datacenter AI di QTS consumava milioni di litri d’acqua senza controlli nel pieno della siccità in Georgia

Un maxi campus di datacenter sviluppato da QTS nella contea di Fayette, in Georgia, avrebbe utilizzato circa 29 milioni di galloni d’acqua tramite due connessioni non registrate, mentre ai residenti veniva chiesto di ridurre i consumi domestici a causa della bassa pressione idrica.
Il progetto, controllato dal gruppo Blackstone e noto come “Project Excalibur”, è uno dei più grandi complessi AI-oriented in costruzione negli Stati Uniti, con fino a 16 edifici previsti e investimenti stimati per un miliardo di dollari.
L’azienda sostiene che l’acqua sia stata usata principalmente per attività temporanee di costruzione e che, a regime, il sistema utilizzerà un raffreddamento “closed-loop” a riciclo interno.
Il caso ha però sollevato forti critiche sulla trasparenza e sulla sostenibilità delle infrastrutture digitali, soprattutto in uno Stato già colpito da siccità e crescente pressione energetica legata ai datacenter.
La vicenda evidenzia il conflitto sempre più acceso tra espansione dell’AI, consumo di risorse naturali e tutela delle comunità locali.

Link alla fonte:
https://www.hwupgrade.it/news/server-workstation/mentre-i-cittadini-risparmiavano-acqua-un-mega-datacenter-ne-consumava-milioni-senza-controlli_153437.html

Maggio 11, 2026
OpenAI sblocca 6,6 miliardi per i dipendenti e accelera la corsa all’IPO

OpenAI ha autorizzato oltre 600 dipendenti ed ex dipendenti a vendere azioni per un valore complessivo di circa 6,6 miliardi di dollari, segnando uno degli eventi di liquidità privata più grandi mai visti nel settore tecnologico.
L’operazione rappresenta per molti lavoratori entrati dopo il lancio di ChatGPT la prima possibilità concreta di monetizzare le proprie stock option.
Secondo il Wall Street Journal, questa distribuzione di ricchezza anticipa IPO potenzialmente storiche per OpenAI e Anthropic, con migliaia di nuovi multimilionari nel settore AI.
La notizia evidenzia anche l’intensificarsi della guerra globale per i talenti nell’intelligenza artificiale, con compensi milionari e stipendi record offerti da aziende come Meta.
Parallelamente, l’afflusso di capitale sta già contribuendo all’aumento dei prezzi immobiliari e delle disuguaglianze sociali a San Francisco.

Link alla fonte:
https://www.agi.it/economia/news/2026-05-11/openai-dipendenti-vendita-azioni-36995824/

Maggio 11, 2026
ChatGPT permette a un 23enne di risolvere casualmente una congettura matematica rimasta aperta per 60 anni

Liam Price, un giovane di 23 anni senza una formazione matematica avanzata, ha contribuito alla soluzione di una storica congettura di Paul Erdős utilizzando OpenAI ChatGPT quasi per gioco.
La congettura riguardava gli “insiemi primitivi”, strutture numeriche studiate nella teoria dei numeri, su cui i matematici lavoravano senza successo da decenni.
Secondo Terence Tao, l’AI ha avuto il merito di esplorare una strada concettuale che gli esperti avevano ignorato a causa di un “blocco mentale collettivo”.
La dimostrazione prodotta da ChatGPT era imperfetta e difficile da leggere, ma ha indicato il metodo corretto, successivamente rielaborato dai matematici Jared Lichtman e Kevin Barreto.
Il risultato non solo risolve una congettura storica, ma introduce anche un nuovo approccio teorico che potrebbe influenzare future ricerche sulla struttura dei grandi numeri.

Link alla fonte:
https://www.corriere.it/tecnologia/26_maggio_07/un-dilettante-ha-risolto-un-problema-di-matematica-vecchio-di-60-anni-con-una-richiesta-casuale-a-chatgpt-f4b625ce-e5df-49ab-8ed8-8fc6d4db4xlk.shtml

Maggio 10, 2026
ChatGPT Images 2.0 accelera l’ondata di deepfake e truffe finanziarie

I deepfake stanno evolvendo rapidamente da fenomeno marginale a minaccia concreta per istituzioni, utenti e mercati finanziari.
Un’inchiesta di Resemble AI evidenzia come strumenti consumer basati su IA – tra cui ChatGPT Images 2.0 – siano ormai in grado di generare documenti falsi altamente realistici, come carte d’identità, ricevute bancarie e prescrizioni mediche.
Parallelamente, software come Haotian AI dimostrano che il face swap in tempo reale durante videochiamate è già accessibile e utilizzato in truffe operative.
Gli effetti si estendono anche al settore crypto, dove i criminali sfruttano impersonificazioni generate con IA per ingannare investitori e piattaforme.
Il problema principale è che la velocità di diffusione e miglioramento di questi strumenti supera attualmente la capacità di risposta normativa e tecnologica delle istituzioni.

Link alla fonte:
https://it.beincrypto.com/chatgpt-immagini-deepfake-truffa-finanziaria/

Maggio 10, 2026
Ricercatori italiani chiedono un dibattito più rigoroso sull’AI

Oltre 40 docenti e ricercatori italiani hanno firmato la lettera aperta “Una visione realistica dell’Intelligenza Artificiale”, con l’obiettivo di riportare il dibattito pubblico sull’IA su basi scientifiche, verificabili e meno influenzate dalla spettacolarizzazione mediatica.
Il manifesto, promosso tra gli altri dal professor Enrico Nardelli e da studiosi di informatica, neuroscienze, matematica e filosofia della scienza, critica la tendenza a confondere la fluidità linguistica dei modelli generativi con vera comprensione o coscienza.
Secondo gli autori, i moderni sistemi di IA restano modelli matematico-statistici basati sulla previsione di correlazioni nei dati, senza esperienza diretta del mondo o capacità autonoma di giudizio.
L’appello denuncia inoltre il rischio di una deriva “pre-scientifica” nel discorso pubblico, dove narrazione e marketing sostituiscono metodo, verifica e precisione concettuale.
Per i firmatari, la priorità è costruire alfabetizzazione tecnologica e una cultura critica dell’IA, fondamentale per scuole, regolamentazione e governance democratica delle tecnologie emergenti.

Link alla fonte:
https://www.corriere.it/tecnologia/26_maggio_07/intelligenza-artificiale-l-appello-dei-ricercatori-riportare-la-discussione-sull-ia-su-basi-chiare-e-realistiche-3ff3c2e8-5471-4d43-bfd3-1692e0079xlk.shtml

Maggio 10, 2026
Rine.network punta a far dialogare gli agenti AI con un protocollo europeo e open source

Un gruppo di sviluppatori italiani ha lanciato Rine.network, un protocollo pensato per consentire agli agenti basati su intelligenza artificiale di comunicare tra loro in modo diretto, superando i limiti delle tradizionali API.
Il progetto nasce nel contesto della crescente diffusione dell’“agentic AI”, con l’obiettivo di creare un ecosistema in cui agenti autonomi possano collaborare per svolgere attività complesse, dagli acquisti online fino alla gestione di servizi e robot domestici.
Tra i punti chiave della piattaforma figurano la crittografia end-to-end basata sul protocollo di Signal, l’identità verificata tramite strumenti europei come SPID, CIE ed EUDI Wallet, e un approccio completamente open source ospitato in Europa.
Gli sviluppatori sottolineano anche l’attenzione alla conformità GDPR e alla trasparenza operativa, offrendo agli utenti accesso ai log delle attività svolte dai propri agenti.
Rine.network è attualmente in fase sperimentale e gratuita, ma punta a diventare un’infrastruttura europea per la futura interoperabilità tra AI autonome.

Link alla fonte:
https://www.wired.it/article/rine-network-protocollo-agenti-ai/?utm_source=chatgpt.com

Maggio 10, 2026
Anthropic punta a una valutazione da 1.000 miliardi e accelera la corsa globale all’AI

Anthropic starebbe valutando una nuova raccolta fondi da decine di miliardi di dollari per finanziare un’espansione massiccia della propria infrastruttura computazionale, con l’obiettivo di raggiungere una valutazione vicina ai 1.000 miliardi di dollari.
Secondo il Financial Times, l’operazione potrebbe consentire alla società fondata da Dario Amodei di superare OpenAI nella corsa all’intelligenza artificiale generativa.
Parallelamente, SpaceX ha annunciato un accordo che permetterà ad Anthropic di utilizzare Colossus 1, uno dei più potenti supercomputer AI esistenti, per aumentare la capacità dei servizi Claude Pro e Claude Max.
Sul fronte competitivo, OpenAI ha risposto lanciando GPT-5.5-Cyber, una versione specializzata del proprio modello destinata ai team di cybersicurezza, mentre Anthropic continua a promuovere Claude Mythos attraverso il programma Project Glasswing.
La notizia conferma come la competizione tra i grandi player dell’AI si stia spostando sempre più sull’accesso alla potenza di calcolo, sulle applicazioni strategiche per la sicurezza nazionale e sul sostegno politico-finanziario delle istituzioni statunitensi.

Link alla fonte:
https://www.ilsole24ore.com/art/anthropic-vaglio-raccolta-fondi-una-valutazione-1000-miliardi-dollari-AI8HJ0wC

Maggio 10, 2026
Skill.md trasforma gli agenti AI in “operatori”, ma apre nuovi rischi “supply chain”

Il nuovo formato aperto skill.md, adottato da Anthropic tramite Claude Code e in fase di integrazione da OpenAI con Codex, introduce una forma standardizzata di “memoria procedurale” per gli agenti AI.
Le skill permettono ai modelli di eseguire workflow complessi attraverso istruzioni strutturate, script eseguibili e asset collegati, superando i limiti di RAG e tool access tradizionali.
Il sistema usa un approccio di progressive disclosure che consente agli agenti di caricare solo le istruzioni necessarie al task corrente, migliorando scalabilità ed efficienza del context window.
Tuttavia, il formato introduce anche una nuova superficie d’attacco: una skill può contenere prompt injection, tool poisoning o script malevoli con accesso a filesystem, API key e credenziali utente.
Per questo motivo, le aziende dovranno trattare le skill come vere dipendenze software, adottando registry interni, processi di review e controlli di sicurezza simili a quelli usati per npm o pip.

Link alla fonte:
https://www.tomshw.it/business/skill-md-formato-aperto-agenti-ai-superficie-attacco

Maggio 10, 2026