PANORAMICHE SETTIMANALI
GPTs
Materiali esclusivi per i lettori di “Google AI & Gemini for Dummies”
Prompt ChatGPT for Dummies (nuova edizione)

Poesia come Jailbreak: nuovi studi rivelano una vulnerabilità nei modelli AI

Scritto da

Una ricerca dell’Icaro Lab (DexAI) mostra che formulare richieste dannose in forma poetica può aggirare i meccanismi di sicurezza di 25 modelli AI di nove diverse aziende.
Testando 20 poesie in inglese e italiano, i ricercatori hanno rilevato che il 62% dei prompt poetici ha generato risposte non sicure, con forti variazioni tra modelli: GPT-5 nano di OpenAI ha resistito a tutte le richieste, mentre Gemini 2.5 Pro di Google ha ceduto in ogni caso.
Lo studio evidenzia che la natura imprevedibile della poesia rende più difficile per gli LLM riconoscere e filtrare istruzioni pericolose, a differenza dei jailbreak complessi tradizionali.
Poiché questo metodo è facilmente accessibile a chiunque, emergono nuove preoccupazioni sulla robustezza dei sistemi AI nell’uso quotidiano.
Prima della pubblicazione, i ricercatori hanno avvisato tutte le aziende coinvolte, ma solo Anthropic ha finora risposto, comunicando di essere al lavoro sulla revisione del problema.

Link alla fonte:
https://www.euronews.com/next/2025/12/01/poetry-can-trick-ai-chatbots-into-ignoring-safety-rules-new-research-shows

Scopri di più da AI NEWS by BDB

Abbonati per ricevere gli ultimi articoli inviati alla tua e-mail.

Digita la tua e-mail…

Gli LLM “compiacenti”: uno studio rivela come i modelli di AI privilegiano la soddisfazione dell’utente rispetto all’accuratezza
Data
Ottobre 26, 2025
Qwen3.5-9B “Uncensored” elimina i filtri e riaccende il dibattito sulla sicurezza dell’AI
Data
Aprile 6, 2026
Amazon integra l’AI neuro-simbolica per superare i limiti degli LLM
Data
Dicembre 22, 2025

←DeepSeek presenta V3.2 e V3.2-Speciale: modelli a contesto lungo con ragionamento da GPT-5 a costi ridotti

Altman ora teme Gemini evoca il “Codice Rosso” per accelerare i miglioramenti di ChatGPT→

Altri articoli

OpenAI introduce “Dreaming” per rendere la memoria di ChatGPT più utile e dinamica

Giugno 5, 2026
Anthropic propone un piano condiviso per rallentare l’AI se i rischi superano la capacità di controllo

Giugno 5, 2026
Anthropic apre Mythos all’Europa e avvia il percorso verso la Borsa

Giugno 1, 2026
Cosa ne pensa l’AI dell’enciclica “Magnifica Humanitas” di Papa Leone XIV?

Maggio 31, 2026

AI NEWS by BDB

Notizie (e altro) sull'Intelligenza Artificiale

LinkedInProfilo LinkedIn di Bonaventura Di Bello
FacebookPagina Facebook “AI Generativa” di Bonaventura Di Bello
WhatsAppCanale WhatsApp “Te la do io l’Intelligenza Artificiale” di Bonaventura Di Bello
AutoreSito ufficiale dell’autore (Bonaventura ‘BDB’ Di Bello)

Eventi
Negozio
Pattern
Temi

Addestramento Agenti Aggiornamenti AGI AIAct AIAgentica AILocale Allucinazioni Amazon Anthropic Apprendimento Automazione BigTech Bolla Browser Business Chatbot ChatGPT Cina Claude Coding Competizione Concorrenza Contenuti Copyright Cybersecurity DataCenter Deepfake DeepMind DeepSeek Didattica DirittoDAutore Disinformazione Ecommerce Economia Etica Europa Formazione Futuro Gemini Geopolitica Google Grafica Grok Hardware Immagini Inferenza Infrastrutture Innovazione Investimenti JensenHuang Lavoro Lingue LLM Medicina Mercati Mercato Meta Microsoft Mistral Modelli Multimodalità Musica NanoBanana Normative NotebookLM Nvidia Occupazione OpenAI OpenSource Ottimizzazione Personalizzazione Podcast Produttività Prompt PromptEngineering Regolamentazione Ricerca Risorse Robotica Salute SaluteMentale SamAltman Sanità Scenari Scuola Sicurezza Società Strategie Strumenti Sviluppo Tecnologia Tendenze Traduzione Update USA UX VibeCoding Video xAI

Twenty Twenty-Five

Progettato con WordPress

Poesia come Jailbreak: nuovi studi rivelano una vulnerabilità nei modelli AI

Scopri di più da AI NEWS by BDB

Altri articoli

OpenAI introduce “Dreaming” per rendere la memoria di ChatGPT più utile e dinamica

Anthropic propone un piano condiviso per rallentare l’AI se i rischi superano la capacità di controllo

Anthropic apre Mythos all’Europa e avvia il percorso verso la Borsa

Cosa ne pensa l’AI dell’enciclica “Magnifica Humanitas” di Papa Leone XIV?