Categoria: News

  • Google e OpenAI accelerano sull’AI efficiente con Gemini 3.1 Flash-Lite e GPT-5.3 Instant

    Google e OpenAI hanno presentato quasi in parallelo due aggiornamenti ai loro modelli di intelligenza artificiale con l’obiettivo di migliorare efficienza, velocità e qualità delle risposte.
    Google ha introdotto Gemini 3.1 Flash-Lite, un modello progettato per applicazioni su larga scala che offre costi molto ridotti per milione di token e prestazioni più rapide rispetto alla generazione precedente, rendendolo adatto a traduzioni massive, moderazione dei contenuti e automazioni in tempo reale.
    Parallelamente OpenAI ha rilasciato GPT-5.3 Instant, focalizzato sul miglioramento dell’esperienza conversazionale: risposte più naturali, meno premesse difensive e una riduzione significativa delle allucinazioni nei test interni.
    L’aggiornamento introduce anche una migliore integrazione tra ricerca web e ragionamento del modello, con risposte più pertinenti e sintetiche.
    Le due novità evidenziano una tendenza comune nel settore: rendere i modelli AI non solo più potenti, ma anche più economici, affidabili e adatti all’uso quotidiano da parte di sviluppatori, aziende e utenti finali.

    Link alle fonti:

    https://www.hdblog.it/google/articoli/n650481/gemini-3-1-flash-lite-google/

    https://www.hdblog.it/applicazioni/articoli/n650392/openai-rilascia-gpt-53-instant/

  • I modelli di AI affrontano “Humanity’s Last Exam” per misurare la distanza dalla AGI

    I principali modelli di intelligenza artificiale — ChatGPT, Gemini, Claude e DeepSeek — sono stati sottoposti a Humanity’s Last Exam, un benchmark estremo progettato per valutare quanto siano vicini al livello di conoscenza degli esperti umani.
    Il test, pubblicato sulla rivista Nature e sviluppato dal Center for AI Safety insieme a Scale AI, comprende 2.500 domande di livello dottorale distribuite su oltre 100 discipline.
    A febbraio 2026 il miglior risultato è stato ottenuto da Gemini 3 Deep Think con il 48,4%, ancora distante dal circa 90% raggiunto dagli esperti umani nei rispettivi campi.
    I ricercatori sottolineano che, nonostante i rapidi progressi, superare questo benchmark non equivarrebbe automaticamente a raggiungere l’intelligenza artificiale generale (AGI).
    Lo studio riaccende quindi il dibattito su quanto tempo manchi davvero prima che l’IA raggiunga capacità paragonabili a quelle umane nella ricerca e nel ragionamento avanzato.

    Link alla fonte:
    https://www.elconfidencial.com/tecnologia/2026-03-05/ia-ultimo-examen-humanidad-agi-1qrt_4313376/

  • Anthropic: blackout di Claude tra disservizi e tensioni con il Pentagono (e intanto OpenAI perde consensi, anzi guadagna dissenso)

    Claude.ai di Anthropic ha subito oggi un blackout che ha generato migliaia di segnalazioni e disagi per gli utenti, coinvolgendo sia il chatbot sia il servizio di coding Claude Code. L’azienda ha parlato di «errori significativi» in alcuni servizi, precisando che le API risultano operative mentre sono in corso indagini sulle cause del problema.
    L’episodio arriva in un momento delicato in cui Anthropic, guidata dal ceo Dario Amodei, avrebbe perso un contratto con il Pentagono dopo aver ribadito le proprie “linee rosse” contro l’uso militare dell’AI per sorveglianza di massa e armi autonome letali.
    Nel contempo, OpenAI ha annunciato un accordo con il Dipartimento della Difesa Usa, alimentando il dibattito sull’impiego bellico dell’intelligenza artificiale.
    Il blackout, pur critico sul piano operativo, ha riacceso l’attenzione su Claude nel confronto competitivo con ChatGPT, e sui social diversi utenti hanno invitato a “mollare” il chatbot di OpenAI dopo la notizia dell’intesa con il Pentagono, segnalando come le scelte etiche delle aziende stiano diventando un fattore sempre più rilevante nella percezione e nel posizionamento dei principali modelli AI.

    Link alla fonte:
    https://www.milanofinanza.it/news/claude-di-anthropic-in-blackout-utenti-nel-caos-202603021622045679