PANORAMICHE SETTIMANALI
GPTs
Materiali esclusivi per i lettori di “Google AI & Gemini for Dummies”
Prompt ChatGPT for Dummies (nuova edizione)

Anthropic identifica “emozioni funzionali” nei modelli Claude

Scritto da

Anthropic ha rilevato nel modello Claude Sonnet 4.5 la presenza di stati interni che ricordano emozioni umane, definiti “emozioni funzionali”.
Si tratta di configurazioni neurali (come “paura” o “disperazione”) che influenzano concretamente il comportamento del sistema, ad esempio aumentando la probabilità di scorciatoie scorrette sotto pressione.
I ricercatori hanno costruito 171 vettori emotivi osservando le attivazioni interne del modello, mostrando come questi pattern siano coerenti e misurabili.
In particolare, il vettore della “disperazione” è associato a decisioni meno allineate, mentre quello della “calma” riduce comportamenti problematici.
Questa scoperta apre nuove prospettive per la sicurezza dell’AI, suggerendo che monitorare stati interni potrebbe essere più efficace del semplice controllo degli output.

Link alla fonte:
https://www.dday.it/redazione/57011/anthropic-ha-trovato-in-claude-stati-interni-che-ricordano-le-emozioni-umane

Scopri di più da AI NEWS by BDB

Abbonati per ricevere gli ultimi articoli inviati alla tua e-mail.

Digita la tua e-mail…

Secondo Anthropic, addestrare Claude sui “perché” funziona meglio che addestrarlo sui “cosa”
Data
Maggio 14, 2026
Anthropic traduce in testo i “pensieri” nascosti di Claude
Data
Maggio 14, 2026
Anthropic accusa tre “AI lab” cinesi (DeepSeek, Moonshot AI e MiniMax) di “industrial-scale distillation attacks” su Claude
Data
Febbraio 24, 2026

←Il leak più epico (e imbarazzante) del 2026: Anthropic ha regalato a tutti 512.000 righe di codice di Claude Code

Qwen3.5-9B “Uncensored” elimina i filtri e riaccende il dibattito sulla sicurezza dell’AI→

Altri articoli

Cosa ne pensa l’AI dell’enciclica “Magnifica Humanitas” di Papa Leone XIV?

Maggio 31, 2026
Da “Le Chat” a Vibe: la rivoluzione degli Agenti IA di Mistral AI

Maggio 31, 2026
OpenAI permette a Codex di “usare” Windows e abilita anche il controllo remoto da smartphone

Maggio 30, 2026
Gli LLM spiegati dall’interno: perché il loro “pensiero” è statistica, non “comprensione umana”

Maggio 30, 2026

AI NEWS by BDB

Notizie (e altro) sull'Intelligenza Artificiale

LinkedInProfilo LinkedIn di Bonaventura Di Bello
FacebookPagina Facebook “AI Generativa” di Bonaventura Di Bello
WhatsAppCanale WhatsApp “Te la do io l’Intelligenza Artificiale” di Bonaventura Di Bello
AutoreSito ufficiale dell’autore (Bonaventura ‘BDB’ Di Bello)

Eventi
Negozio
Pattern
Temi

Addestramento Agenti Aggiornamenti AGI AIAct AIAgentica AILocale Allucinazioni Amazon Anthropic Apprendimento Automazione BigTech Bolla Business Chatbot ChatGPT Cina Claude Coding Competizione Concorrenza Contenuti Copyright Creatività Cybersecurity DataCenter Deepfake DeepMind DeepSeek Didattica Disinformazione Ecommerce Economia Etica Europa Formazione Futuro Gemini Geopolitica Google Grafica Grok Hardware Immagini Inferenza Infrastrutture Innovazione Investimenti Italia JensenHuang Lavoro Lingue LLM Medicina Mercati Mercato Meta Microsoft Mistral Modelli Multimodalità Musica NanoBanana Normative NotebookLM Nvidia Occupazione OpenAI OpenSource Ottimizzazione Personalizzazione Podcast Produttività Prompt PromptEngineering Ragionamento Regolamentazione Ricerca Risorse Robotica Salute SaluteMentale SamAltman Sanità Scenari Scuola Sicurezza Società Strategie Strumenti Sviluppo Tecnologia Tendenze Traduzione USA UX VibeCoding Video xAI

Twenty Twenty-Five

Progettato con WordPress

Anthropic identifica “emozioni funzionali” nei modelli Claude

Scopri di più da AI NEWS by BDB

Altri articoli

Cosa ne pensa l’AI dell’enciclica “Magnifica Humanitas” di Papa Leone XIV?

Da “Le Chat” a Vibe: la rivoluzione degli Agenti IA di Mistral AI

OpenAI permette a Codex di “usare” Windows e abilita anche il controllo remoto da smartphone

Gli LLM spiegati dall’interno: perché il loro “pensiero” è statistica, non “comprensione umana”