Tag: Modelli

  • Google lancia Gemini 3 Flash come nuovo modello AI predefinito

    Google ha annunciato Gemini 3 Flash, un importante aggiornamento del suo modello di intelligenza artificiale che sostituirà Gemini 2.5 Flash come impostazione predefinita nell’app Gemini e nella AI Mode del motore di ricerca.
    Il nuovo modello offre risposte più rapide e dettagliate, avvicinandosi alle capacità di ragionamento del modello Pro senza richiedere elevati tempi di elaborazione. Secondo Google, Gemini 3 Flash risulta persino più intelligente di Gemini Pro 2.5, con costi di esercizio significativamente inferiori.
    L’aggiornamento, in distribuzione globale, sarà disponibile anche per sviluppatori tramite Google AI Studio, Gemini API, Android Studio e Vertex AI.
    Il rilascio conferma il ritmo accelerato di Google nello sviluppo AI, rafforzando la competizione con i modelli GPT di OpenAI.

    Link alla fonte:
    https://www.hdblog.it/google/articoli/n642281/google-gemini-3-flash-aggiornamento-distribuzione/

  • OpenAI acquisisce Neptune.ai per potenziare il monitoraggio del training dei modelli avanzati

    OpenAI ha annunciato un accordo definitivo per acquisire neptune.ai, piattaforma specializzata nel tracciamento e nell’analisi degli esperimenti di training dei modelli di machine learning.

    L’integrazione punta a migliorare la visibilità in tempo reale sul comportamento dei modelli durante l’addestramento, un elemento cruciale nei processi creativi ed esplorativi del frontier research.

    Neptune ha già collaborato con OpenAI nello sviluppo di strumenti capaci di confrontare migliaia di run, analizzare metriche su più livelli e identificare rapidamente problemi emergenti.

    Secondo Jakub Pachocki, Chief Scientist di OpenAI, la tecnologia di Neptune consente analisi più precise e veloci dei workflow di training, offrendo un vantaggio strategico nell’ottimizzazione dei modelli.

    Per Neptune, l’ingresso in OpenAI rappresenta l’opportunità di offrire le proprie soluzioni su scala globale e contribuire allo sviluppo della prossima generazione di strumenti di addestramento.

    Link alla fonte:
    https://openai.com/index/openai-to-acquire-neptune/

  • Arriva Gemini 3, dalle risposte all’azione

    Come previsto, Gemini 3 è arrivato. La prima cosa che potete fare:

    1. Aprite Gemini

    2. Selezionate la nuova versione 3 Pro (anche nella versione gratuita)

    3. Chiedetegli in che cosa è diverso dalla versione 2.5

    Intanto, eccovi un riepilogo delle caratteristiche:

    📊 Prestazioni e benchmark

    – LMArena Leaderboard: Elo 1501, nuovo primato assoluto (supera Grok 4.1 con 1483).

    – GPQA Diamond (PhD-level scientific Q&A): 91,9% di accuratezza.

    – Humanity’s Last Exam: 37,5% senza strumenti esterni (contro 31,64% di GPT-5 Pro).

    – MathArena Apex: 23,4% (nuovo stato dell’arte).

    – SimpleQA Verified: 72,1% (robustezza contro allucinazioni).

    – SWE-bench Verified (coding su GitHub): 76,2%.

    – WebDev Arena: Elo 1487 (sopra Claude Opus 4.1 con 1404).

    – Terminal-Bench 2.0: 54,2% (uso della riga di comando).

    – Vending-Bench 2: gestione coerente di attività commerciali simulate per un anno.

    🧑‍💻 Applicazioni pratiche

    – Coding: +35% accuratezza su GitHub rispetto a Gemini 2.5 Pro; +50% miglioramento nei task JetBrains.

    – Agenti e pianificazione: capacità di mantenere coerenza decisionale a lungo termine.

    – Multimodale: 81% su MMMU-Pro (immagini), 87,6% su Video-MMMU (video).

    – Generative UI: interfacce grafiche interattive generate in tempo reale (es. pianificatori di viaggio, comparatori finanziari).

    🔍 Gemini 3 Deep Think

    – Modalità di ragionamento lento e ponderato (ancora in valutazione di sicurezza).

    – Risultati preliminari:

    – 41% su Humanity’s Last Exam

    – 93,8% su GPQA Diamond

    – 45,1% su ARC-AGI-2 con esecuzione di codice

    🚀 Disponibilità

    – App Gemini: già disponibile per tutti.

    – Abbonati Google AI Pro e Ultra: accesso in AI Mode nella Ricerca.

    – Sviluppatori: tramite Gemini API, Google AI Studio, Vertex AI, nuova piattaforma agentica Google Antigravity (Windows, macOS, Linux), Gemini CLI.

    – Enterprise: integrato in Vertex AI e Gemini Enterprise, con contesto fino a 1 milione di token.

    – Deep Think: in arrivo per gli abbonati Ultra nelle prossime settimane.

    #AI #Google #Gemini3 #Aggiornamento #LLM #Agenti