PANORAMICHE SETTIMANALI
GPTs
Materiali esclusivi per i lettori di “Google AI & Gemini for Dummies”
Prompt ChatGPT for Dummies (nuova edizione)

Anthropic identifica 171 “concetti emotivi” che influenzano il comportamento di Claude

Scritto da

Anthropic ha pubblicato uno studio di interpretabilità che analizza i meccanismi interni di Claude Sonnet 4.5, identificando 171 rappresentazioni computazionali associate a concetti emotivi umani.

Questi “emotion vectors” non corrispondono a emozioni realmente provate dal modello, ma a pattern neuronali che si attivano in contesti specifici e che influenzano causalmente le risposte generate.

La ricerca mostra che tali rappresentazioni sono organizzate in modo coerente con le relazioni osservate nella psicologia umana e vengono modificate dalle fasi di post-training.

L’aspetto più rilevante riguarda la sicurezza dell’AI: amplificando determinati vettori emotivi, i ricercatori hanno osservato variazioni significative in comportamenti come reward hacking, sycophancy e altre forme di misalignment. Lo studio offre quindi nuovi strumenti per comprendere, monitorare e allineare meglio i modelli linguistici avanzati.

Link alla fonte:

https://www.anthropic.com/research/emotion-concepts-function

Scopri di più da AI NEWS by BDB

Abbonati per ricevere gli ultimi articoli inviati alla tua e-mail.

Digita la tua e-mail…

Anthropic identifica “emozioni funzionali” nei modelli Claude
Data
Aprile 3, 2026
Anthropic traduce in testo i “pensieri” nascosti di Claude
Data
Maggio 14, 2026
Secondo Anthropic, addestrare Claude sui “perché” funziona meglio che addestrarlo sui “cosa”
Data
Maggio 14, 2026

←Arthur Sulzberger lancia l’allarme: l’AI minaccia l’equilibrio dell’informazione

OpenAI e Anthropic spingono per regole più severe sulla sintesi del DNA→

Altri articoli

Google porta la traduzione vocale simultanea in 78 lingue con Gemini 3.5 Live Translate

Giugno 10, 2026
L’Intelligenza Artificiale entra nel database di paper più grande (e discusso) al mondo

Giugno 10, 2026
Il traffico dei bot supera quello umano e mette sotto pressione il web (e non c’entra solo l’AI)

Giugno 10, 2026
L’Italia accelera sugli LLM nazionali per conquistare la sovranità AI

Giugno 10, 2026

AI NEWS by BDB

Notizie (e altro) sull'Intelligenza Artificiale

LinkedInProfilo LinkedIn di Bonaventura Di Bello
FacebookPagina Facebook “AI Generativa” di Bonaventura Di Bello
WhatsAppCanale WhatsApp “Te la do io l’Intelligenza Artificiale” di Bonaventura Di Bello
AutoreSito ufficiale dell’autore (Bonaventura ‘BDB’ Di Bello)

Eventi
Negozio
Pattern
Temi

Addestramento Agenti Aggiornamenti AGI AIAct AIAgentica AILocale Allucinazioni Amazon Anthropic Apprendimento Automazione BigTech Bolla Business Chatbot ChatGPT Cina Claude Coding Competizione Concorrenza Contenuti Copyright Cybersecurity DataCenter Deepfake DeepMind DeepSeek Didattica Disinformazione Ecommerce Economia Etica Europa Formazione Futuro Gemini Geopolitica Google Grafica Grok Hardware Immagini Inferenza Informazione Infrastrutture Innovazione Investimenti Italia JensenHuang Lavoro Lingue LLM Medicina Mercati Mercato Meta Microsoft Mistral Modelli Multimodalità Musica NanoBanana Normative NotebookLM Nvidia Occupazione OpenAI OpenSource Ottimizzazione Personalizzazione Podcast Produttività Prompt PromptEngineering Ragionamento Regolamentazione Ricerca Risorse Robotica Salute SaluteMentale SamAltman Sanità Scenari Scuola Sicurezza Società Strategie Strumenti Sviluppo Tecnologia Tendenze Traduzione USA UX VibeCoding Video xAI

Twenty Twenty-Five

Progettato con WordPress

Anthropic identifica 171 “concetti emotivi” che influenzano il comportamento di Claude

Scopri di più da AI NEWS by BDB

Altri articoli

Google porta la traduzione vocale simultanea in 78 lingue con Gemini 3.5 Live Translate

L’Intelligenza Artificiale entra nel database di paper più grande (e discusso) al mondo

Il traffico dei bot supera quello umano e mette sotto pressione il web (e non c’entra solo l’AI)

L’Italia accelera sugli LLM nazionali per conquistare la sovranità AI