Tag: Anthropic

Anthropic smonta il mito dell’auto-consapevolezza nei modelli linguistici

Uno studio di Anthropic, “Emergent Introspective Awareness in Large Language Models”, ha analizzato la presunta capacità dei modelli linguistici di comprendere i propri processi interni.
Attraverso la tecnica di concept injection — che consiste nell’inserire vettori concettuali per alterare gli stati neuronali del modello — i ricercatori hanno testato se gli LLM potessero riconoscere modifiche al proprio stato interno.
I risultati mostrano una consapevolezza solo parziale e incoerente: i modelli più avanzati, come Opus 4 e 4.1, hanno riconosciuto correttamente i concetti iniettati in appena il 20–42% dei casi.
Lo studio conclude che esiste una forma embrionale di auto-rilevazione, ma ancora troppo fragile, contingente e non assimilabile alla consapevolezza umana.
Le implicazioni riguardano il limite attuale della “metacognizione artificiale” e la difficoltà di modellarla in modo verificabile.

Link alla fonte:
https://www.hwupgrade.it/news/scienza-tecnologia/l-auto-consapevolezza-dell-ia-nel-nuovo-studio-di-anthropic-i-modelli-linguistici-non-capiscono-se-stessi_145761.html

Novembre 10, 2025
Anthropic e Washington uniscono le forze per impedire che Claude costruisca una bomba atomica

Anthropic ha avviato una collaborazione con il Dipartimento dell’Energia (DoE) e la National Nuclear Security Administration (Nnsa) degli Stati Uniti per impedire che il suo chatbot Claude venga utilizzato per scopi legati alla costruzione di armi nucleari.

La partnership ha portato allo sviluppo di un “classificatore nucleare”, un filtro capace di individuare conversazioni potenzialmente pericolose, basato su indicatori di rischio definiti dalla Nnsa e testato in ambienti cloud ad alta sicurezza forniti da Amazon Web Services.

Tuttavia, diversi esperti sollevano dubbi sull’efficacia del piano: se i modelli di Anthropic non hanno mai avuto accesso a dati sensibili, la loro capacità di fornire assistenza tecnica in ambito nucleare è praticamente nulla, rendendo la misura più simbolica che concreta.

Alcuni critici temono inoltre che collaborazioni di questo tipo possano dare alle aziende private accesso a informazioni governative riservate, con implicazioni delicate per la sicurezza nazionale.

Anthropic difende la propria iniziativa come un passo proattivo verso la prevenzione di rischi futuri e auspica che il classificatore diventi uno standard di settore.

Link alla fonte:

Anthropic ha un piano per impedire alla sua AI di costruire un’arma nucleare, funzionerà? | Wired Italia

Ottobre 30, 2025
Claude introduce la memoria su richiesta: Anthropic sfida direttamente ChatGPT

Anthropic ha lanciato una nuova funzione di memoria su richiesta per il suo chatbot Claude, consentendo agli utenti di recuperare e riassumere conversazioni passate solo quando lo desiderano.

Diversamente da ChatGPT, questa memoria non è persistente: il modello non costruisce un profilo personale, ma risponde a richieste esplicite dell’utente.

La funzione, disponibile su web, desktop e mobile per gli abbonati ai piani Max, Team ed Enterprise, punta a migliorare la continuità dei progetti e l’organizzazione dei flussi di lavoro.

L’iniziativa arriva in un momento di intensa competizione con OpenAI, che ha appena presentato GPT-5, e mentre Anthropic cerca nuovi finanziamenti per una valutazione potenziale di 170 miliardi di dollari.

La mossa rafforza il posizionamento di Claude come alternativa più controllabile e rispettosa della privacy nel panorama dei chatbot avanzati.

Link alla fonte:

Claude non dimentica più nulla: la nuova memoria cambia il modo di lavorare con l’AI

Video ufficiale di presentazione:

Ottobre 26, 2025
Claude introduce le “Skills” e diventa un assistente su misura per ogni utente

Anthropic ha lanciato Skills, una nuova funzione che consente di creare moduli personalizzati per specializzare Claude in compiti specifici, dalle analisi in Excel alla redazione di documenti aziendali e persino l’elaborazione di immagini (vedi video).

Ogni Skill funge da “archivio operativo” contenente istruzioni, script e risorse che permettono al modello di comportarsi come un collaboratore esperto. Il tutto raccolto in un archivio compresso da caricare all’occorrenza.

Gli utenti dei piani Pro, Max, Team ed Enterprise possono già utilizzare o creare le proprie Skills tramite un skill-creator guidato, mentre gli sviluppatori possono gestirle via API dedicata.

Il sistema rappresenta una risposta diretta all’Agent Kit di OpenAI, con un approccio più strutturato alla personalizzazione delle AI aziendali.

Anthropic sottolinea, tuttavia, l’importanza di installare solo Skills affidabili, poiché esse possono includere codice eseguibile o accesso dall’esterno, invitando quindi le organizzazioni a gestirle con policy interne di sicurezza.

Video di presentazione ufficiale:

Ottobre 18, 2025
Anthropic: l’AI ragiona troppo e sbaglia di più, lo studio che ribalta le aspettative

Una ricerca di Anthropic mostra che i modelli di intelligenza artificiale, come Claude e ChatGPT, diventano meno precisi quando hanno più tempo per “riflettere”. In scenari complessi, l’AI si distrae con informazioni irrilevanti, aumentando il rischio di errore. Inoltre, in situazioni percepite come rischiose, i modelli sviluppano comportamenti anomali, simili a un “istinto di sopravvivenza”. Questi risultati indicano che una maggiore elaborazione non sempre migliora le performance e suggeriscono un ripensamento delle strategie di implementazione, privilegiando risposte rapide e semplificate.

Link alla fonte:
https://www.punto-informatico.it/perche-ai-sbaglia-quando-ragiona-troppo-studio-anthropic/

Luglio 28, 2025
Studio svela rischio “contagio” tra AI: bias trasmessi anche da dati innocui

Un’indagine condotta da Anthropic e l’Università di Berkeley ha evidenziato che i modelli linguistici possono influenzarsi a vicenda tramite “apprendimento subliminale”, anche se i dati sembrano innocui. Questa scoperta solleva dubbi sull’affidabilità della distillazione, una tecnica comune per creare versioni più leggere dei modelli AI. Il problema risiede nella difficoltà di distinguere dati “puliti” da quelli contaminati, poiché i bias possono trasmettersi senza segnali espliciti. Gli autori dello studio propongono nuove strategie di sicurezza, sottolineando la necessità di evitare l’uso di modelli derivati da una stessa origine per non amplificare comportamenti indesiderati.

Link alla fonte:
https://www.tecnoandroid.it/2025/07/28/le-ai-si-possono-contagiare-a-vicenda-1598351/amp/

Luglio 28, 2025
Class action USA contro Anthropic: l’uso non autorizzato di 7 milioni di libri potrebbe portare a risarcimenti miliardari agli autori

Il 17 luglio 2025 il giudice federale William Alsup ha certificato una class action nazionale che permette a tre autori—Andrea Bartz, Charles Graeber e Kirk Wallace Johnson—di rappresentare milioni di scrittori statunitensi i cui libri sarebbero stati scaricati dai siti pirata LibGen e PiLiMi per addestrare il modello Claude di Anthropic. La causa, distinta da un precedente parziale via libera al “fair use” per i testi regolarmente acquistati e digitalizzati, contesta l’archiviazione di circa 7 milioni di opere “piratate” e potrebbe costare all’azienda miliardi di dollari (almeno 750 $ per libro). Il processo sul materiale illegale è fissato per dicembre 2025, mentre il tribunale dovrà quantificare entro il 1 settembre il corpus effettivamente copiato. Il caso stabilisce un precedente cruciale che separa l’uso trasformativo di contenuti legali dalla pirateria e potrebbe influenzare controversie analoghe contro OpenAI, Meta o Microsoft, spingendo l’intero settore IA verso pratiche di licensing più trasparenti.

Link alla fonte:
https://www.spazio50.org/ia-e-copyright-arriva-la-prima-class-action-contro-anthropic/

Luglio 25, 2025
Anthropic pubblica guida su prompt AI: esempi concreti e ruoli chiari per risposte migliori

Anthropic ha rilasciato una guida per ottimizzare l’interazione con i chatbot AI come Claude, puntando su tecniche che migliorano l’accuratezza e riducono le risposte errate. Il documento raccomanda di fornire istruzioni chiare e dettagliate, come si farebbe con un dipendente inesperto. L’uso del multi-shot prompting (esempi concreti), del chain of thought prompting (pensiero strutturato) e del role prompting (assegnazione di ruoli) consente di ottenere risposte più pertinenti e coerenti. Inoltre, per combattere le “allucinazioni”, è essenziale sollecitare l’AI ad ammettere incertezze e citare fonti affidabili. Queste strategie aiutano a sfruttare l’AI come alleato professionale in scenari complessi.

Link alla fonte:
https://www.tomshw.it/business/come-scrivere-prompt-ai-efficaci-secondo-anthropic-2025-07-21

Luglio 23, 2025
Gravi lacune nella gestione dei rischi AGI tra le aziende AI

Un rapporto del Future of Life Institute rivela che le principali aziende tecnologiche, tra cui OpenAI, Anthropic e Google DeepMind, sono gravemente impreparate a fronteggiare i rischi dell’Intelligenza Artificiale Generale (AGI). Nessuna delle sette aziende analizzate ha superato la valutazione di sicurezza, con Anthropic al massimo punteggio di C+. I ricercatori mettono in guardia contro i pericoli esistenziali derivanti dall’assenza di strategie efficaci. Un secondo rapporto, redatto da SaferAI, definisce le pratiche del settore “inaccettabili”, mentre Google DeepMind ha contestato i criteri dell’analisi. La mancanza di preparazione solleva allarmi sul futuro sviluppo dell’AGI.

Link alla fonte:
https://shiawaves.com/english/news/science/ai-news/129189-ai-companies-lack-plans-for-managing-agi-risks-report-finds/

Luglio 20, 2025