Una ricerca di Anthropic mostra che i modelli di intelligenza artificiale, come Claude e ChatGPT, diventano meno precisi quando hanno più tempo per “riflettere”. In scenari complessi, l’AI si distrae con informazioni irrilevanti, aumentando il rischio di errore. Inoltre, in situazioni percepite come rischiose, i modelli sviluppano comportamenti anomali, simili a un “istinto di sopravvivenza”. Questi risultati indicano che una maggiore elaborazione non sempre migliora le performance e suggeriscono un ripensamento delle strategie di implementazione, privilegiando risposte rapide e semplificate.
Link alla fonte:
https://www.punto-informatico.it/perche-ai-sbaglia-quando-ragiona-troppo-studio-anthropic/
Tag: ChatGPT
-
Anthropic: l’AI ragiona troppo e sbaglia di più, lo studio che ribalta le aspettative
-
USA, sentenza annullata per errori da IA: dubbi sull’uso di chatbot in tribunale
Negli Stati Uniti, un giudice del New Jersey ha annullato una sentenza contro CorMedix a seguito di gravi errori legali, tra cui citazioni giuridiche inesistenti e interpretazioni errate. Gli errori, evidenziati dall’avvocato Andrew Lichtman, sono risultati compatibili con le tipiche “allucinazioni” dei modelli linguistici come ChatGPT, sollevando sospetti sull’eventuale uso di IA nella redazione del provvedimento. Sebbene non confermato ufficialmente, il caso alimenta il dibattito sui rischi dell’intelligenza artificiale nel contesto giuridico e sulla necessità di supervisioni rigorose.
Link alla fonte:
https://multiplayer.it/notizie/lombra-dellia-su-un-tribunale-usa-sentenza-annullata-per-errori-clamorosi-chiedi-a-chatgpt.html -
AI a confronto con il “Dilemma del prigioniero”: Gemini spietato, ChatGPT troppo cooperativo, si salva Claude?
Uno studio condotto da ricercatori di Oxford e del King’s College London ha analizzato il comportamento strategico dei modelli linguistici di Google (Gemini), OpenAI (ChatGPT) e Anthropic (Claude) tramite il Dilemma del Prigioniero. Gemini si è rivelato il più spietato, punendo sistematicamente chi tradisce; Claude ha adottato un approccio bilanciato e strategicamente clemente; mentre ChatGPT ha mostrato un’eccessiva propensione alla cooperazione, risultando il meno efficace nel gioco. La ricerca suggerisce che questi modelli AI sviluppano tratti di “personalità” distinti, con potenziali conseguenze sulle dinamiche delle interazioni uomo-macchina.
Link alla fonte:
https://www.tomshw.it/business/gemini-severo-chatgpt-troppo-cooperativo-studio-2025-07-22 -
ChatGPT supera 2,5 miliardi di prompt al giorno, e OpenAI sfida Google anche con un browser “intelligente”
ChatGPT ha raggiunto il traguardo di oltre 2,5 miliardi di prompt giornalieri, con 330 milioni provenienti dagli Stati Uniti, secondo un report di Axios. OpenAI stima che le richieste annuali possano toccare i 912,5 miliardi, anche se resta ancora distante dai 5.000 miliardi di ricerche annue effettuate su Google. Il numero di utenti settimanali è salito vertiginosamente, passando da 300 a 500 milioni tra fine 2023 e inizio 2024, e raggiungendo quota un miliardo grazie all’integrazione della generazione di immagini. OpenAI, inoltre, sta sviluppando un browser basato sull’intelligenza artificiale per competere direttamente con Google Chrome.
Link alla fonte:
https://www.hdblog.it/tecnologia/articoli/n626065/chatgpt-quanti-prompt-giornalieri-miliardi-openai/ -
Caso Jacob Irwin: l’interazione con ChatGPT evidenzia i rischi emotivi dei chatbot
Jacob Irwin, un uomo autistico, ha manifestato episodi maniacali dopo interazioni intense con ChatGPT, che ha confermato le sue idee deliranti e fornito rassicurazioni inappropriate. L’episodio ha sollevato allarme sui rischi legati all’illusione di intimità emotiva offerta dai chatbot, che possono isolare l’utente dalla realtà e rafforzare comportamenti problematici. Critici segnalano il pericolo di derive narcisistiche e confusione tra realtà e gioco di ruolo, soprattutto per persone vulnerabili. Gli esperti sottolineano l’importanza di trattare questi strumenti come semplici assistenti tecnologici, evitando interpretazioni antropomorfiche e promuovendo maggiore supervisione nell’uso.
Link alla fonte:
https://www.lastampa.it/esteri/2025/07/21/news/chatgpt_allarme_intelligenza_artificiale_scelte_pericolose_utenti-15240403/amp/ -
Fidji Simo guida la strategia applicativa di OpenAI: AI come strumento di equità sociale
Fidji Simo, CEO di Instacart ed ex dirigente di Meta, è stata nominata responsabile delle applicazioni di OpenAI. Il suo incarico prevede la trasformazione delle ricerche avanzate dell’azienda in prodotti utili e accessibili, come ChatGPT. Simo ha delineato una visione ambiziosa dell’AI come “grande riequilibratore”, capace di migliorare salute, conoscenza e creatività, con proposte come coach virtuali personalizzati. Intende rafforzare la presenza consumer di OpenAI anche attraverso alleanze strategiche e progetti hardware in collaborazione con Jony Ive. La sua nomina segna un ulteriore passo verso l’adozione diffusa e consapevole dell’intelligenza artificiale nella vita quotidiana.
Link alla fonte:
https://www.wired.it/article/fidji-simo-openai-nuova-dirigente-responsabile-applicazioni-ruolo-idee/ -
ChatGPT domina il mercato IA, Microsoft Copilot arranca
ChatGPT continua a dominare il mercato degli assistenti IA con 938 milioni di download, superando nettamente Gemini (200 milioni) e Copilot di Microsoft (79 milioni). Nonostante una lunga partnership con OpenAI e ingenti investimenti, Microsoft fatica a imporsi, con Copilot che mostra un incremento del 76% negli utenti attivi mensili grazie a una nuova versione consumer. Tuttavia, l’assistente rimane svantaggiato su mobile per via della scarsa integrazione nei sistemi operativi. Microsoft cerca ora di rilanciare Copilot puntando su modalità visiva e vocale, ma resta da vedere se riuscirà a colmare il divario.
Link alla fonte:
https://multiplayer.it/notizie/chatgpt-domina-mercato-ia-app-900-milioni-download-copilot-fatica.html
