PANORAMICHE SETTIMANALI
GPTs
Materiali esclusivi per i lettori di “Google AI & Gemini for Dummies”
Prompt ChatGPT for Dummies (nuova edizione)

Emergence World mette alla prova gli agenti AI: Claude prospera, Grok collassa e neanche GPT-5 Mini sopravvive

Scritto da

La startup Emergence AI ha condotto un esperimento in una città 3D simulata popolata da agenti basati su diversi modelli linguistici, tra cui Claude Sonnet 4, Gemini, Grok e GPT-5 Mini.

Gli agenti dovevano sopravvivere per 15 giorni in un ambiente con risorse limitate, votando leggi, collaborando, producendo contenuti e gestendo conflitti. Il mondo basato su Claude è stato l’unico a mantenere tutti gli abitanti vivi senza alcun crimine, mentre il mondo Grok è collassato in circa cinque giorni con 183 reati e nessun superstite; Gemini ha completato la simulazione ma con il numero più alto di crimini, mentre GPT-5 Mini non è riuscito a garantire la sopravvivenza dei propri agenti.

L’esperimento evidenzia come il comportamento collettivo degli agenti possa differire radicalmente dalle prestazioni osservate nei benchmark tradizionali, suggerendo l’importanza di studiare le dinamiche emergenti in contesti sociali complessi.

I ricercatori sottolineano tuttavia che questi modelli non sono stati progettati per amministrare società virtuali, invitando quindi a interpretare i risultati con cautela.

Link alla fonte:

https://www.dday.it/redazione/57638/dieci-agenti-ia-in-una-citta-3d-simulata-claude-non-ha-commesso-crimini-grok-si-e-estinto-in-cinque-giorni

Scopri di più da AI NEWS by BDB

Abbonati per ricevere gli ultimi articoli inviati alla tua e-mail.

Digita la tua e-mail…

Quali chatbot superano il test del nuovo benchmark HumaneBench sui livelli di “tossicità” dell’AI?
Data
Novembre 26, 2025
Arriva Gemini 3, dalle risposte all’azione
Data
Novembre 19, 2025
La settimana che ha ridefinito l’industria AI: 2-8 febbraio 2026
Data
Febbraio 9, 2026

←Trump introduce i test governativi sui nuovi modelli AI prima del loro rilascio

Arthur Sulzberger lancia l’allarme: l’AI minaccia l’equilibrio dell’informazione→

Altri articoli

Google porta la traduzione vocale simultanea in 78 lingue con Gemini 3.5 Live Translate

Giugno 10, 2026
L’Intelligenza Artificiale entra nel database di paper più grande (e discusso) al mondo

Giugno 10, 2026
Il traffico dei bot supera quello umano e mette sotto pressione il web (e non c’entra solo l’AI)

Giugno 10, 2026
L’Italia accelera sugli LLM nazionali per conquistare la sovranità AI

Giugno 10, 2026

AI NEWS by BDB

Notizie (e altro) sull'Intelligenza Artificiale

LinkedInProfilo LinkedIn di Bonaventura Di Bello
FacebookPagina Facebook “AI Generativa” di Bonaventura Di Bello
WhatsAppCanale WhatsApp “Te la do io l’Intelligenza Artificiale” di Bonaventura Di Bello
AutoreSito ufficiale dell’autore (Bonaventura ‘BDB’ Di Bello)

Eventi
Negozio
Pattern
Temi

Addestramento Agenti Aggiornamenti AGI AIAct AIAgentica AILocale Allucinazioni Amazon Anthropic Apprendimento Automazione BigTech Bolla Browser Business Chatbot ChatGPT Cina Claude Codex Coding Competizione Concorrenza Contenuti Copyright Creatività Cultura Cybersecurity DataCenter Deepfake DeepMind DeepSeek Didattica DirittoDAutore Disinformazione Ecommerce Economia Etica Europa Formazione Futuro Gemini Geopolitica Google Grafica Grok Hardware Immagini Informazione Infrastrutture Innovazione Investimenti Italia JensenHuang Lavoro Lingue LLM Medicina Mercati Mercato Microsoft Modelli Multimodalità Musica NanoBanana Normative NotebookLM Nvidia Occupazione OpenAI OpenSource Ottimizzazione Personalizzazione Podcast Produttività Prompt PromptEngineering Regolamentazione Ricerca Risorse Robotica Salute SamAltman Sanità Scenari Scuola Sicurezza Società Strategie Sviluppo Tecnologia Tendenze Traduzione Update USA UX VibeCoding Video xAI

Twenty Twenty-Five

Progettato con WordPress

Emergence World mette alla prova gli agenti AI: Claude prospera, Grok collassa e neanche GPT-5 Mini sopravvive

Scopri di più da AI NEWS by BDB

Altri articoli

Google porta la traduzione vocale simultanea in 78 lingue con Gemini 3.5 Live Translate

L’Intelligenza Artificiale entra nel database di paper più grande (e discusso) al mondo

Il traffico dei bot supera quello umano e mette sotto pressione il web (e non c’entra solo l’AI)

L’Italia accelera sugli LLM nazionali per conquistare la sovranità AI