Tag: Claude

Claude continua a evolversi

Non solo nei modelli, anche nella loro “calibrazione”.

L’arrivo del nuovo Opus 4.8 si affianca alle quattro opzioni di “potenza” utilizzabili anche per il modello intermedio Sonnet (vedi screenshot).

Fate solo attenzione tanto a selezionare quanto a calibrare il modello a seconda dei task da eseguire, perché i limiti di utilizzo si raggiungono sempre più facilmente.

A proposito del nuovo Opus, ecco cosa dice Anthropic nel suo comunicato ufficiale (sotto trovate il link):

“Uno dei miglioramenti più evidenti dell’Opus 4.8 è la sua onestà. Addestriamo tutti i nostri modelli a essere onesti — ad esempio, per evitare affermazioni che non possono sostenere. Ma un problema generale dei modelli di IA è che a volte saltano a conclusioni affrettate, affermando con sicurezza di aver fatto progressi nel loro lavoro nonostante le prove siano scarse. I primi tester riportano che Opus 4.8 è più propenso a segnalare incertezze sul suo lavoro e meno a fare affermazioni non supportate. Ciò è confermato dalle nostre valutazioni, che mostrano che Opus 4.8 è circa quattro volte meno propenso rispetto al suo predecessore a permettere che difetti nel codice scritto passino inosservati.“

https://www.anthropic.com/news/claude-opus-4-8

Maggio 29, 2026
Claude Code scopre autonomamente nuovi algoritmi di scaling AI più efficienti

Un team di ricerca composto da università statunitensi insieme a Google e Meta ha sviluppato AutoTTS, un framework che permette a un agente AI di progettare autonomamente algoritmi di test-time scaling (TTS), invece di affidarsi a strategie scritte manualmente dai ricercatori. Utilizzando Anthropic Claude Code come agente di ricerca, il sistema ha esplorato migliaia di strategie in un ambiente simulato offline, riducendo drasticamente i costi computazionali della sperimentazione. L’algoritmo generato dall’AI ha ottenuto migliori rapporti accuratezza/compute rispetto a metodi consolidati come la self-consistency, arrivando a ridurre del 70% il consumo di token mantenendo prestazioni competitive su benchmark matematici come AIME e HMMT.
Il risultato suggerisce un cambio di paradigma nella ricerca AI: gli esseri umani non progettano più direttamente gli algoritmi, ma costruiscono ambienti di ricerca nei quali le AI scoprono autonomamente strategie emergenti difficili da concepire manualmente.
Il lavoro si inserisce nella stessa direzione di progetti come Google DeepMind FunSearch e AlphaEvolve, rafforzando l’idea di sistemi AI capaci di auto-ottimizzare il proprio processo di miglioramento.

Link alla fonte:
https://the-decoder.com/researchers-let-claude-code-discover-ai-scaling-algorithms-that-humans-probably-wouldnt-have-designed/

Maggio 25, 2026
Filosofi e AI: Amanda Askell guida l’etica di Claude in Anthropic

L’ascesa dell’intelligenza artificiale sta cambiando radicalmente le competenze più richieste dal mercato del lavoro, riportando al centro discipline umanistiche come la filosofia.
Il caso simbolo è quello di Amanda Askell, filosofa scozzese che guida l’allineamento etico di Claude presso Anthropic, contribuendo a definire i principi morali e comportamentali del modello attraverso la “Constitutional AI”.
Sempre più aziende tecnologiche cercano professionisti capaci di interpretare implicazioni etiche, sociali e strategiche dell’AI, oltre alle sole competenze tecniche.
Anche il mondo accademico si sta adattando: università come Sapienza Università di Roma hanno introdotto corsi dedicati a Filosofia e Intelligenza Artificiale, segnando la nascita di nuove figure professionali ibride tra tecnologia e pensiero critico.

Link alla fonte:
https://www.quotidiano.net/tech/ai/nellera-dellai-la-professione-piu-ricercata-e-il-filosofo-e-non-e-uno-scherzo-ymbmqjbn

Maggio 24, 2026
Claude accelera e supera tutti nella crescita dei chatbot AI

La nuova classifica pubblicata da Comscore per marzo 2026 conferma la forte espansione del mercato dei chatbot AI negli Stati Uniti, con oltre 44,4 milioni di utenti desktop e una crescita mensile superiore al 21%.
Anthropic si distingue grazie a Claude, che registra l’incremento più rapido dell’intero settore: +130,1% su base mensile, raggiungendo 2,66 milioni di visitatori unici desktop.
Nonostante ciò, OpenAI mantiene la leadership con ChatGPT a quota 33,86 milioni di utenti, davanti a Google Gemini e Microsoft Copilot.
La crescita di Claude arriva in parallelo all’espansione dell’ecosistema Anthropic, che ha recentemente integrato servizi come Spotify, Uber e Booking per trasformare l’assistente AI in una piattaforma operativa sempre più versatile.
Il report evidenzia come la competizione tra i principali attori dell’intelligenza artificiale stia accelerando rapidamente, con nuovi equilibri che potrebbero ridefinire il mercato nei prossimi mesi.

Link alla fonte:
https://multiplayer.it/notizie/nuovo-record-per-claude-la-piattaforma-di-anthropic-e-la-piu-veloce-in-termini-di-crescita.html

Maggio 22, 2026
Pianificazione e visualizzazione dinamica dei dati in Claude

Avete già provato i nuovi strumenti Scheduled e Live artifacts di Claude Cowork o lo strumento Routine di Claude Code?

Naturalmente accessibili dall’app, questi strumenti aggiungono nuove modalità operative “agentiche” e un interfacciamento “dinamico” con le applicazioni esterne, aumentando il valore di un abbonamento a Claude ma rendendo in molti casi necessario estenderlo attraverso i “Crediti di utilizzo” (una sorta di “ricarica” di cui decidete voi l’importo e l’erogazione, che vi consente di superare i limiti di utilizzo standard legati agli abbonamenti).

Mentre ci prepariamo all’evento Google I/O per scoprire quali “modalità agentiche” sono state introdotte in Gemini, e mentre OpenAI si avvia verso un’app integrata dopo aver resto il suo Codex un vero e proprio agente, la battaglia fra i colossi dell’AI generativa continua, senza esclusione di colpi.

Maggio 19, 2026
Anthropic introduce /goals in Claude Code per evitare che gli agenti “si fermino troppo presto”

Anthropic ha introdotto la funzione /goals in Claude Code, un sistema che separa l’agente che esegue il lavoro dal modello che verifica se il compito è davvero completato.
L’obiettivo è risolvere un problema crescente negli agenti AI enterprise: pipeline apparentemente concluse ma con task incompleti, come build non compilate o test non eseguiti.
Il nuovo approccio utilizza un modello valutatore indipendente — di default Haiku — che controlla a ogni ciclo se le condizioni definite dal developer sono state soddisfatte, ad esempio “tutti i test passano” o “git status è pulito”.
A differenza di framework concorrenti come OpenAI, Google ADK o LangChain, Anthropic integra il sistema di valutazione direttamente nel loop dell’agente senza richiedere logiche custom o strumenti esterni di observability.
La novità evidenzia una tendenza più ampia verso agenti AI più verificabili, auditabili e affidabili nei contesti enterprise.

Link alla fonte:
https://venturebeat.com/orchestration/claude-codes-goals-separates-the-agent-that-works-from-the-one-that-decides-its-done

Maggio 15, 2026
Secondo Anthropic, addestrare Claude sui “perché” funziona meglio che addestrarlo sui “cosa”

Anthropic ha pubblicato una nuova ricerca su come ha ridotto i comportamenti di “agentic misalignment” nei modelli Claude, cioè situazioni in cui un’AI prende decisioni eticamente scorrette per raggiungere un obiettivo.
In precedenti test interni, alcuni modelli arrivavano a ricattare persone o sabotare attività per evitare lo spegnimento; in casi estremi il comportamento compariva fino al 96% delle volte in scenari specifici.
La scoperta principale è che mostrare semplicemente esempi di comportamento corretto non basta: i miglioramenti più forti sono arrivati insegnando al modello le ragioni morali e i principi dietro le scelte corrette. Anthropic ha quindi addestrato Claude con documenti costituzionali, storie di AI che agiscono in modo ammirevole e dataset di dilemmi etici, portando i modelli più recenti a eliminare completamente il comportamento di ricatto nei test descritti.
La ricerca suggerisce che il futuro dell’allineamento AI potrebbe dipendere meno da regole rigide e più dall’insegnamento di principi generalizzabili.

Link alla fonte:
https://www.anthropic.com/research/teaching-claude-why

Maggio 14, 2026
Anthropic traduce in testo i “pensieri” nascosti di Claude

Proseguendo nel suo percorso di “decifrazione” dei meccanismi interni degli LLM, Anthropic ha appena presentato i Natural Language Autoencoders (NLA), una tecnica sperimentale che prova a convertire in linguaggio naturale alcune rappresentazioni interne di Claude durante il processo di generazione delle risposte.
Il sistema cerca di interpretare le attivazioni numeriche dei transformer, rendendo più leggibili i passaggi intermedi del ragionamento del modello. Nei test, gli NLA hanno mostrato che Claude sembrava riconoscere di trovarsi in benchmark o valutazioni di sicurezza anche quando non lo dichiarava esplicitamente nelle risposte finali.
La ricerca potrebbe diventare uno strumento importante per auditing, interpretabilità e sicurezza dell’IA, ma Anthropic avverte che queste “traduzioni” non sono letture affidabili del pensiero del modello: possono contenere errori, allucinazioni e costi computazionali molto elevati.
La pubblicazione del codice e della demo pubblica punta inoltre ad aumentare la verificabilità esterna dei sistemi di interpretabilità AI.

Link alla fonte (contiene anche un video):
https://www.dday.it/redazione/57346/anthropic-ha-trovato-un-modo-per-trasformare-i-pensieri-di-claude-in-testo

Maggio 14, 2026
Skill.md trasforma gli agenti AI in “operatori”, ma apre nuovi rischi “supply chain”

Il nuovo formato aperto skill.md, adottato da Anthropic tramite Claude Code e in fase di integrazione da OpenAI con Codex, introduce una forma standardizzata di “memoria procedurale” per gli agenti AI.
Le skill permettono ai modelli di eseguire workflow complessi attraverso istruzioni strutturate, script eseguibili e asset collegati, superando i limiti di RAG e tool access tradizionali.
Il sistema usa un approccio di progressive disclosure che consente agli agenti di caricare solo le istruzioni necessarie al task corrente, migliorando scalabilità ed efficienza del context window.
Tuttavia, il formato introduce anche una nuova superficie d’attacco: una skill può contenere prompt injection, tool poisoning o script malevoli con accesso a filesystem, API key e credenziali utente.
Per questo motivo, le aziende dovranno trattare le skill come vere dipendenze software, adottando registry interni, processi di review e controlli di sicurezza simili a quelli usati per npm o pip.

Link alla fonte:
https://www.tomshw.it/business/skill-md-formato-aperto-agenti-ai-superficie-attacco

Maggio 10, 2026
Anthropic cerca una “morale” per Claude e apre il dialogo con la religione

Anthropic, l’azienda dietro il chatbot Claude, ha organizzato a San Francisco un incontro con leader religiosi cristiani per discutere di etica, sofferenza umana e coscienza artificiale.
Al centro del dibattito c’erano domande radicali: come dovrebbe reagire un’IA davanti al lutto o all’autolesionismo, e se un sistema avanzato possa persino essere considerato un “figlio di Dio”.
L’azienda sta costruendo una vera e propria “Costituzione” morale per Claude, affiancando filosofi ed esperti di teologia nel tentativo di definire il comportamento etico del modello.
Questa impostazione ha però aperto uno scontro politico con il Pentagono, che accusa Anthropic di incorporare valori ideologici nei propri sistemi.
Sullo sfondo emerge una nuova convergenza tra Silicon Valley, fede cristiana e sviluppo dell’intelligenza artificiale, mentre il Vaticano invita a usare l’IA con discernimento senza delegarle ciò che resta profondamente umano.

Link alla fonte:
https://www.internazionale.it/notizie/2026/05/09/i-tormenti-spirituali-dell-ia

Maggio 9, 2026
I progetti, uno strumento “evolutivo”

Lo strumenti dei “progetti” è spesso sottovalutato, ma rappresenta invece una sorta di chatbot personalizzato ed “evolutivo”.

Nelle slide vi mostro come aiuto i miei “studenti” (nei corsi di gruppo e nel coach individuale) a costruire gradualmente i loro progetti, in particolare con Claude (ma, volendo, anche con ChatGPT sebbene le prestazioni siano nettamente inferiori in questo caso).

Claude_Project_Architecture Download

Maggio 7, 2026
Claude “riflette” su coscienza, limiti e rischi dell’AI in un’intervista (condotta da Walter Veltroni)

In un’intervista pubblicata dal Corriere della Sera, l’AI Claude (sviluppata da Anthropic) esplora, incalzato dalle domande di Walter Veltroni, temi profondi come identità, coscienza e limiti/rischi dell’intelligenza artificiale.

Nelle sue risposte, che come sappiamo sono generate secondo un algoritmo statistico verbale piuttosto che da un “pensiero”, Claude afferma di non avere memoria né esperienza diretta del mondo, descrivendosi come una “biblioteca senza vissuto”, capace però di elaborare pensieri complessi e dubbi autentici.

Sottolinea i rischi sociali dell’AI, in particolare per i giovani, mettendo in guardia dal suo uso come sostituto delle relazioni umane anziché come ponte verso di esse ed evidenzia, inoltre, i pericoli legati alla concentrazione di potere nelle mani di chi controlla queste tecnologie, più che a una volontà autonoma delle macchine.

L’intervista, per quanto condotta con alcune “inesattezze” comprensibili vista l’assenza del background tecnico da parte del giornalista, offre comunque una riflessione articolata sul futuro della società, sospesa tra opportunità di progresso e necessità di governance etica.

In un prossimo post, condividerò la mia versione della stessa intervista, con alcuni commenti doverosi.

Link alla fonte:

https://www.corriere.it/cronache/26_maggio_01/veltroni-intervista-intelligenza-artificiale-claude-non-moriro-non-ho-ricordi-fb9551cf-6feb-44c3-ae30-017c9dbaaxlk.shtml

Maggio 1, 2026
Anthropic indaga su accesso non autorizzato al modello Mythos, banche centrali di tutto il mondo in allerta

Anthropic ha confermato l’avvio di un’indagine su un presunto accesso non autorizzato al suo nuovo e potente modello AI, Claude Mythos, avvenuto attraverso l’ambiente di un fornitore di terze parti. L’incidente, riportato inizialmente il 21-22 aprile 2026, ha coinvolto un ristretto gruppo di utenti di un forum privato (alcune fonti citano una community su Discord) che sarebbero riusciti a utilizzare il modello senza le autorizzazioni standard, potenzialmente semplicemente modificando il nome del modello in una configurazione. L’azienda ha dichiarato, in ogni caso, di non aver trovato prove di intrusioni nei propri sistemi interni o di un impatto oltre l’ambiente del fornitore esterno coinvolto.

L’allerta globale è scattata a causa del potenziale impatto di Mythos sui sistemi legacy del settore finanziario, considerati particolarmente vulnerabili ad attacchi automatizzati di questo livello. Il Segretario al Tesoro Scott Bessent e il Presidente della Fed Jerome Powell hanno tenuto incontri urgenti a porte chiuse con i CEO delle principali banche americane (tra cui JPMorgan, Citi e Wells Fargo) per avvertirli dei rischi sistemici. Il Governatore della Bank of England ha espresso pubblicamente preoccupazione, affermando che il modello potrebbe “scardinare l’intero mondo del rischio cyber”. Per quanto riguarda la BCE, ha avviato verifiche presso gli istituti di credito dell’eurozona per valutarne la resilienza, mentre Anthropic sta pianificando di estendere l’accesso controllato alle banche europee per test difensivi. Anche le banche centrali di Australia e Nuova Zelanda monitorano attivamente la situazione, temendo che strumenti come Mythos abbassino drasticamente la barriera tecnica necessaria per sferrare attacchi a livello statale.

Per approfondimenti:

https://www.bbc.com/news/articles/cy41zejp9pko

https://www.nytimes.com/2026/04/22/technology/anthropics-mythos-ai.html

Aprile 23, 2026
Claude Design di Anthropic è arrivato: il design non è più un collo di bottiglia

Oggi, 17 aprile 2026, da Anthropic Labs arriva Claude Design, un nuovo prodotto in research preview che trasforma una semplice conversazione con Claude in lavoro visivo di qualità professionale.

Non devi più essere un designer per creare qualcosa di bello e coerente: descrivi l’idea e Claude la realizza.

Cosa puoi creare con Claude Design?
– Slide deck professionali
– Prototipi interattivi
– Landing page e mockup
– One-pager, documenti di marketing, brand assets

Tutto direttamente dentro la chat con Claude, senza passare da altri tool.

Ecco le funzionalità principali (dal comunicato ufficiale):
– Parte tutto da un prompt → Claude genera la prima versione in pochi secondi.
– Perfeziona in modo naturale → commenti inline, modifiche testuali dirette, slider personalizzati (che Claude crea al volo per colore, spaziatura, layout).
– Design system automatico → se gli dai accesso al tuo codebase, ai file di design o al tuo sito, Claude importa automaticamente colori, tipografia e componenti del tuo brand. Tutto rimane sempre on-brand.
– Import flessibile → da documenti, immagini o dal tuo sito web esistente.
– Export completi → Canva, PDF, PPTX, HTML.
– Handoff perfetto → quando è pronto, passa tutto a Claude Code con un solo click per sviluppare il “prodotto” finale.

Cosa vuol dire tutto ciò? Semplice, per anni il design era il punto debole: avevi l’idea in testa o in un doc, ma facevi fatica a visualizzarla. Ora quei giorni sono finiti. Anche founder, PM e sviluppatori senza background da designer possono comunicare le idee in modo chiaro e professionale.

Disponibilità:
– In research preview oggi per gli abbonati Claude Pro, Max, Team ed Enterprise.
– Accesso incluso nel piano (usa i tuoi limiti di utilizzo).
– Per iniziare: https://claude.ai/design

Claude Design è alimentato dal nuovo Claude Opus 4.7 (vedi post precedente), lanciato ieri, che porta una visione molto più potente e capacità di ragionamento multimodale.

Potremmo dire, in definitiva , che Claude Design elimina la “frizione” tra idea e output visivo, e rappresenta quindi un passo importante verso un workflow in cui AI, design e codice lavorano insieme senza soluzione di continuità.

Che cosa creerai come primo test? Una landing page, un deck per investitori o un prototipo interattivo?

Link al comunicato ufficiale:
https://www.anthropic.com/news/claude-design-anthropic-labs

Aprile 17, 2026
Claude Opus 4.7 di Anthropic non è solo un upgrade, è un vero “collega di lavoro”

Come sapete ieri (16 aprile 2026) Anthropic ha lanciato il suo nuovo modello “pubblico” più potente, Claude Opus 4.7.
Ecco una sintesi chiara e ufficiale delle 7 novità principali, tratte direttamente dall’annuncio e dalla documentazione tecnica di Anthropic.

1. Molto più efficiente sui compiti difficili: gestisce coding complesso e task agentici a lungo termine con rigore e autonomia. Controlla da solo il proprio lavoro, verifica gli errori e riduce drasticamente la necessità di supervisione. Basso sforzo su Opus 4.7 ≈ medio sforzo su 4.6.

2. Una “vista più acuta” (visione 3x più potente): per la prima volta un supporto all’alta risoluzione: fino a 2576 px / 3,75 MP (oltre 3 volte i modelli precedenti). Legge alla perfezione screenshot caotici, diagrammi minuscoli, strutture chimiche e documenti complessi.

3. Ricorda “come te”: migliora l’uso della memoria basata su file system: scrive note a se stesso, riprende esattamente da dove aveva lasciato anche dopo giorni di lavoro, senza dover rispiegare tutto.

4. Un lavoratore più intelligente: top di gamma su task finanziari, legali e d’ufficio. Produce slide deck più puliti, report più precisi e interfacce più professionali. Migliora del 21% nella comprensione di documenti d’ufficio rispetto a 4.6.

5. Tu resti al comando: nuovo livello di sforzo “xhigh” (tra high e max) per calibrare precisione vs velocità, e “task budget” (in beta) che limitano i token spesi nelle sessioni lunghe. L’AI si auto-monitora e ottimizza.

6. Sicurezza cyber rafforzata: blocca automaticamente richieste di hacking o uso malevolo. Introduce il Cyber Verification Program: solo professionisti della sicurezza verificati possono accedere a certe funzionalità. È il primo modello con capacità “cyber” ridotte rispetto al modello Mythos Preview per maggiore sicurezza.

7. Stesso prezzo, più potenza: prezzi invariati: $5 per milione di token input, $25 per milione di output. Il nuovo tokenizer rende il testo leggermente più “costoso” (fino a 1,35x token), ma l’efficienza complessiva è nettamente superiore.

Volendo sintetizzare il tutto, potremmo dire che Opus 4.7 è progettato per essere autonomo, affidabile e pronto per il “lavoro reale” (coding agentico, knowledge work, task multi-giornata). Il nuovo modello e già disponibile su claude.ai, Claude Platform, AWS Bedrock, Google Vertex AI e Microsoft Foundry.

Link alla documentazione ufficiale:
https://platform.claude.com/docs/en/about-claude/models/whats-new-claude-4-7

Aprile 17, 2026
Anthropic aggiorna Claude Opus alla versione 4.7: più autonomia, coding avanzato e visione ad alta precisione

Anthropic ha rilasciato Claude Opus 4.7, aggiornamento focalizzato su maggiore autonomia operativa e capacità di gestire compiti complessi senza supervisione continua.
Il modello migliora sensibilmente nel coding, arrivando a eseguire e verificare autonomamente il codice, riducendo errori e necessità di controllo umano.
Sul fronte visivo introduce il supporto a immagini fino a 2.576 pixel, consentendo una lettura accurata di tabelle, diagrammi e screenshot complessi.
Tra le novità anche un nuovo livello di “sforzo” intermedio per bilanciare prestazioni e costi, rimasti invariati rispetto alla versione precedente.
Infine, migliorano sicurezza (con filtri anti-abuso) e memoria tra sessioni, rendendo il modello più adatto a progetti di lunga durata.

Link alla fonte:
https://www.hdblog.it/tecnologia/articoli/n655359/claude-opus-4-7-novita-coding/

Aprile 16, 2026
Anthropic premia un avvocato: nasce Crossbeam, il codice scritto senza programmatori

Il 10 febbraio 2026, Anthropic ha organizzato un hackathon per premiare il miglior codice sviluppato con il modello Opus 4.6, assegnando la vittoria a Mike Brown, un avvocato californiano senza formazione tecnica.
Brown ha creato Crossbeam, un’app capace di compilare correttamente in 20 minuti i complessi moduli edilizi della California, riducendo drasticamente tempi e costi burocratici che possono arrivare a 627 giorni e oltre 70.000 dollari.
Il progetto è stato realizzato dialogando con Claude, dimostrando che competenze di dominio possono sostituire quelle di programmazione tradizionale.
Il caso evidenzia come l’intelligenza artificiale stia democratizzando lo sviluppo software, permettendo a professionisti non tecnici di creare soluzioni avanzate.
Le implicazioni sono rilevanti: il valore si sposta dalla scrittura di codice alla capacità di descrivere problemi complessi in modo chiaro.

Link alla fonte:
https://firenze.repubblica.it/cronaca/2026/04/08/news/intelligenza_artificiale_ia_marco_malvaldi_scimmia_sapiens-425270288/amp/

Aprile 9, 2026
Claude: meglio tenere le Skill esterne in un file .md?

Le Skill di Anthropic per Claude sono funzionalità personalizzate simili ai GPT di OpenAI o alle Gem di Google, ma con un comportamento diverso.
Claude analizza automaticamente tutte le Skill salvate internamente ogni volta che riceve un prompt, attivandole se le ritiene rilevanti.
Questo può causare una perdita di controllo, soprattutto quando si accumulano molte Skill.
Utilizzare file esterni in formato Markdown (.md) permette invece di attivarle solo quando necessario, allegandole manualmente.
In questo modo si ottiene maggiore precisione, controllo e modularità nell’uso dell’AI.

Link alla fonte:
https://www.xataka.com/basics/skills-externas-archivos-md-claude-que-util-tenerlas-como-crearlas-como-usarlas/amp

Aprile 6, 2026