Tag: Gemini

Se non state usando i task “pianificati” dell’AI vi perdete un sacco di opportunità

Poco fa Gemini mi ha fornito il suo resoconto settimanale sulle ultime notizie di tecnologia, basato sulle mie istruzioni, e ho potuto farglielo “leggere” semplicemente facendo clic sull’icona dell’altoparlante, come fosse un podcast.

Anche in questo caso, come sempre, è l’efficacia del prompt che fa la differenza, e quello che ho usato per il test non è neanche tanto elaborato, eppure il risultato è già soddisfacente.

E voi, per cosa usate già o vorreste usare la pianificazione nel vostro chatbot abituale?

Febbraio 21, 2026
Gemini ora genera musica, grazie a Lyra3

Lyria 3 è il modello di intelligenza artificiale più avanzato sviluppato da Google DeepMind per la generazione di musica.
È stato rilasciato proprio oggi, 18 febbraio 2026, ed è integrato direttamente nell’app Gemini (e sul web), permettendo a chiunque (maggiorenni) di creare tracce musicali originali di 30 secondi in modo molto semplice.
Il rollout è graduale, e inizialmente sarà disponibile nella versione su browser, poi nell’app mobile di Gemini.
Principali caratteristiche di Lyria 3:
– Trasforma prompt testuali in brani completi (testo + musica + voce)
– Accetta anche immagini o video come input: Gemini genera una canzone che “si ispira” al mood o al contenuto visivo
– Genera automaticamente i testi (non serve più scriverli a mano come nelle versioni precedenti)
– Puoi controllare genere, stile, mood, tempo, tipo di voce, strumentazione…
– Qualità audio dichiarata molto alta: meno artefatti rispetto a concorrenti tipo Suno, suono più naturale e complesso
– Progettato per creazione originale: non imita letteralmente artisti esistenti (se metti un nome tipo “nello stile di Taylor Swift” ma lo prende come ispirazione generica mood/stile, non copia)
– Ci sono filtri anti-copyright e watermark digitali per tutelare i diritti.

Febbraio 18, 2026
Google conferma l’uso malevolo di Gemini da parte di gruppi APT

Secondo un rapporto del Google Threat Intelligence Group, gruppi APT (Advanced Persistent Threat, ossia organizzazioni di hacker altamente strutturate e spesso sponsorizzate da Stati, specializzate in attacchi mirati e di lunga durata) legati a Cina, Iran, Corea del Nord e Russia stanno sfruttando in modo sistematico il modello Gemini per potenziare le proprie operazioni cyber offensive.
Tra i casi documentati figurano attori cinesi come APT31 e Temp.HEX, che avrebbero utilizzato l’AI per analisi di vulnerabilità, tecniche di Remote Code Execution e bypass dei firewall applicativi.
L’iraniano APT42 avrebbe invece impiegato Gemini per accelerare lo sviluppo e il debugging di strumenti malevoli.
Il report evidenzia anche malware AI-nativi come HonestCue, che genera payload C# fileless tramite API, e CoinBait, kit phishing costruito con strumenti di code generation.
Oltre all’uso offensivo, Google segnala tentativi su larga scala di distillazione del modello, configurando un furto di proprietà intellettuale che alimenta la crescente corsa agli armamenti nell’AI.

Link alla fonte:
https://www.tomshw.it/hardware/hacker-sfruttano-gemini-ai-in-tutti-gli-attacchi-2026-02-12

Febbraio 15, 2026
Quando non puoi combatterli, unisciti a loro: l’AI personalizzata entra in aula e trasforma l’apprendimento (almeno negli USA)

Alla W. P. Carey School of Business dell’Arizona State University, nuovi strumenti di intelligenza artificiale stanno cambiando il modo in cui studenti e docenti affrontano lo studio e l’insegnamento.

Applicazioni come NotebookLM permettono di trasformare materiali didattici in podcast e risorse di studio multimodali, facilitando l’apprendimento flessibile.

I docenti Atif Ikram e Scott Emett hanno mostrato come bot personalizzati, avatar digitali e strumenti di “vibecoding” possano migliorare il coinvolgimento degli studenti e ridurre il carico operativo per i professori.

L’iniziativa rientra nell’AI Enhanced Teaching Initiative, che promuove un’adozione responsabile dell’AI secondo il principio di “Principled Innovation”.

L’esperienza evidenzia come i bot AI possano ampliare le possibilità pedagogiche senza sostituire il ruolo umano del docente.

Link alla fonte:

https://news.wpcarey.asu.edu/20260205-how-custom-ai-bots-are-changing-classroom

Febbraio 6, 2026
Google introduce Agentic Vision: la visione artificiale diventa investigativa con Gemini 3 Flash

Google ha presentato Agentic Vision, una nuova capacità integrata in Gemini 3 Flash che trasforma l’analisi delle immagini in un processo attivo e verificabile.
A differenza della visione artificiale tradizionale, il modello adotta un ciclo Think-Act-Observe, generando ed eseguendo codice Python per ispezionare, ritagliare e analizzare porzioni specifiche delle immagini.
Questa architettura riduce le allucinazioni e migliora l’accuratezza su contenuti visivi complessi come infografiche, tabelle e documenti tecnici.
Agentic Vision è già sperimentabile tramite Google AI Studio e tramite le API Gemini disponibili anche su Vertex AI, aprendo nuovi scenari applicativi in ambito industriale, documentale e di controllo qualità.

Link alla fonte:
https://www.ilsoftware.it/come-provare-google-agentic-vision-per-leggere-e-rielaborare-il-contenuto-delle-immagini/

Gennaio 31, 2026
Google trasforma la Ricerca in una conversazione con Gemini 3 (domanda: SEO e sponsorizzate che fine fanno?)

Google annuncia un nuovo cambio di paradigma per la Ricerca, che passa dal modello “cerco e clicco” a un’esperienza sempre più conversazionale.
Sui dispositivi mobile, gli utenti possono ora passare senza interruzioni da AI Overview alla modalità AI Mode, mantenendo il contesto delle domande come in una chat.
Al centro di questa evoluzione c’è Gemini 3, che diventa il modello predefinito globale per le risposte AI nella Ricerca, migliorando precisione e gestione delle query complesse.
Secondo Robby Stein, l’obiettivo è un’esperienza “fluida”, con risposte immediate e la possibilità di approfondire tramite dialogo.
Il risultato è una Ricerca che privilegia continuità e interazione, riducendo il peso dei link senza eliminarli.

Link alla fonte:
https://www.ilsole24ore.com/art/google-cambia-ancora-ricerca-gemini-3-diventa-nuovo-motore-dell-ai-AI7sNc5

Gennaio 29, 2026
Google separa i limiti d’uso di Gemini 3 e aumenta le quote per Thinking

Google ha aggiornato i limiti di utilizzo dei modelli Gemini 3 nell’app Gemini, separando le quote tra le versioni Thinking e Pro, che prima condividevano lo stesso tetto giornaliero.
La decisione nasce dal feedback degli utenti, che chiedevano maggiore chiarezza e controllo nella scelta del modello più adatto ai diversi compiti.
Con il nuovo sistema, l’uso del modello Thinking non incide più sui limiti del Pro, consentendo una gestione più flessibile delle attività.
Gli abbonati AI Pro ottengono ora 300 prompt/giorno per Thinking e 100 per Pro, mentre AI Ultra sale a 1500 prompt/giorno per Thinking mantenendo 500 per Pro.
Anche gli utenti gratuiti beneficiano della separazione, sebbene con accesso più limitato.

Link alla fonte:
https://9to5google.com/2026/01/14/gemini-3-usage-limits-update/

Gennaio 16, 2026
Google porta Gemini in Siri: accordo strategico che ridisegna l’AI di Apple

Google e Apple hanno siglato un accordo pluriennale che porterà i modelli della famiglia Gemini a costituire la base dei Foundation Models di Siri.
La nuova generazione dell’assistente vocale di Apple sfrutterà una versione personalizzata della tecnologia AI di Google, con debutto previsto nel corso dell’anno.
La scelta conferma le indiscrezioni circolate da mesi e rappresenta una vittoria strategica per Google nel mercato dell’intelligenza artificiale generativa.
L’intesa potrebbe rafforzare la posizione competitiva di Gemini rispetto a ChatGPT, mettendo sotto pressione anche OpenAI, già partner di Apple con Apple Intelligence.
Restano ignoti i dettagli economici, anche se alcune stime parlano di un accordo da circa un miliardo di dollari l’anno.

Link alla fonte:
https://www.punto-informatico.it/gemini-siri/

Gennaio 13, 2026
Google Classroom integra Gemini per trasformare le lezioni in podcast didattici

Google ha introdotto una nuova funzione in Google Classroom che utilizza Gemini, il suo modello di intelligenza artificiale, per generare podcast didattici personalizzati.
Gli insegnanti possono scegliere argomento, livello scolastico, obiettivi formativi e stile narrativo (dialogo, intervista, tavola rotonda) per creare lezioni audio destinate agli studenti.
L’obiettivo è rendere l’apprendimento più accessibile e in linea con le abitudini della Gen Z, sempre più incline ai contenuti audio on-demand.
Tuttavia, molti docenti esprimono dubbi sulla qualità e sull’accuratezza dei contenuti generati dall’AI, nonché sul tempo necessario per verificarli.
La funzione è attualmente disponibile per gli utenti di Google Workspace for Education.

Link alla fonte:
https://www.punto-informatico.it/google-classroom-trasforma-lezioni-podcast-gemini/

Gennaio 9, 2026
NotebookLM introduce esportazioni e Tabelle Dati per aumentare la produttività prima di introdurre Gemini 3

Google ha introdotto nuovi miglioramenti per NotebookLM in vista del passaggio a Gemini 3, previsto entro la fine dell’anno.
L’assistente di ricerca AI, ancora basato su Gemini 2.5, ora consente di esportare note e report per modificarli al di fuori della piattaforma, facilitando la collaborazione senza obbligare i destinatari a usare NotebookLM.
È stata inoltre introdotta la funzione Tabelle Dati, che organizza informazioni non strutturate in tabelle chiare e facilmente leggibili.
Queste tabelle possono essere esportate direttamente in Fogli di Google, rendendo più semplice l’analisi e la condivisione dei dati.
Al momento la funzione è riservata agli utenti AI Pro e Ultra, ma arriverà anche nella versione gratuita nelle prossime settimane.

Link alla fonte:
https://www.hdblog.it/tecnologia/articoli/n642565/notebooklm-funzionalita-caos-produttivita/

Dicembre 21, 2025
Google lancia Gemini 3 Flash come nuovo modello AI predefinito

Google ha annunciato Gemini 3 Flash, un importante aggiornamento del suo modello di intelligenza artificiale che sostituirà Gemini 2.5 Flash come impostazione predefinita nell’app Gemini e nella AI Mode del motore di ricerca.
Il nuovo modello offre risposte più rapide e dettagliate, avvicinandosi alle capacità di ragionamento del modello Pro senza richiedere elevati tempi di elaborazione. Secondo Google, Gemini 3 Flash risulta persino più intelligente di Gemini Pro 2.5, con costi di esercizio significativamente inferiori.
L’aggiornamento, in distribuzione globale, sarà disponibile anche per sviluppatori tramite Google AI Studio, Gemini API, Android Studio e Vertex AI.
Il rilascio conferma il ritmo accelerato di Google nello sviluppo AI, rafforzando la competizione con i modelli GPT di OpenAI.

Link alla fonte:
https://www.hdblog.it/google/articoli/n642281/google-gemini-3-flash-aggiornamento-distribuzione/

Dicembre 18, 2025
Google integra NotebookLM in Gemini per potenziare le fonti allegate ai prompt

Google ha iniziato il rollout dell’integrazione tra Gemini e NotebookLM, consentendo agli utenti di interrogare Gemini utilizzando uno o più notebook di NotebookLM come contesto affidabile.
La funzione, individuata inizialmente da TestingCatalog, permette di sfruttare le capacità di ragionamento di Gemini direttamente sulle proprie fonti caricate, migliorando notevolmente ricerca, sintesi e scrittura.
Al momento l’integrazione risulta disponibile solo su Gemini web e non per tutti gli account, suggerendo un rilascio graduale.
La novità si inserisce in una fase di rapida evoluzione di NotebookLM, che ha appena ricevuto nuove funzionalità e un piano Ultra con limiti più elevati.

Link alla fonte:
https://www.androidpolice.com/google-gemini-just-got-a-big-notebooklm-upgrade/

Dicembre 17, 2025
Altman ora teme Gemini evoca il “Codice Rosso” per accelerare i miglioramenti di ChatGPT

Il CEO di OpenAI, Sam Altman, ha inviato un memo interno dichiarando una situazione di “codice rosso” e chiedendo al team di concentrare gli sforzi sul miglioramento dell’esperienza quotidiana di ChatGPT, alla luce della crescente pressione competitiva dopo il successo di Google Gemini 3.
Le priorità includono risposte più rapide e affidabili, una personalizzazione più avanzata e una maggiore capacità di gestire domande diversificate, mentre vengono rinviate iniziative come l’integrazione di annunci, gli strumenti di shopping AI e l’assistente personale Pulse.
Il responsabile di ChatGPT, Nick Turley, ha ribadito l’obiettivo di rendere il servizio più intuitivo e personale, sostenendo che l’assistente rappresenta circa il 10% dell’attività di ricerca e mantiene il primato globale.
Nel frattempo, emergono indizi tecnici su possibili future integrazioni pubblicitarie, nonostante dichiarazioni pubbliche passate più caute.
Il contesto competitivo è stato chiaramente intensificato dal recente lancio di Google Gemini 3, che ha superato molti modelli concorrenti nei benchmark e ottenuto ampi riconoscimenti, spingendo OpenAI a una reazione strategica immediata.

Link alla fonte:
https://www.forbes.com/sites/siladityaray/2025/12/02/altman-code-red-memo-urges-chatgpt-improvements-amid-growing-threat-from-google-reports-say/

Dicembre 2, 2025
Google restringe l’accesso gratuito a Gemini 3 Pro per “sovraccarico di richiesta”

Google ha ridotto l’accesso gratuito a Gemini 3 Pro dopo un’improvvisa ondata di richieste seguita al lancio del modello in Italia e dell’engine visivo Nano Banana Pro.
Il limite iniziale di 5 prompt al giorno (e 3 immagini per Nano Banana Pro) è stato sostituito da un generico “Basic access” dai confini variabili, segno di una gestione più elastica per contenere il traffico.
Anche NotebookLM ha dovuto sospendere temporaneamente funzioni chiave come Infographics e Slide Decks per gli utenti free, applicando limiti aggiuntivi ai piani Pro a causa di un sovraccarico dei server.
Le funzionalità visive, appena integrate nella scheda Studio, promettevano una forte spinta creativa, ma ora risultano parzialmente inaccessibili.
La mossa indica che Google mira a preservare la stabilità del servizio e che potrebbe spingere ulteriormente verso i piani a pagamento in futuro.

Link alla fonte:
https://www.hdblog.it/google/articoli/n640072/gemini-3-pro-limiti-account-gratis-pro-nano-banana/

Novembre 28, 2025
Nano Banana Pro è davvero una “macchina del tempo”

Ho appena testato il prompt “49,3684327, -0,8681529 6 giugno 1944” dopo avere individuato su Google Maps un punto su una delle spiagge della Sbarco in Normandia, ottenendo l’immagine che vedete qui sotto.
Prima che fosse generata, il nuovo algoritmo di “ragionamento” alla base di Nano Banana Pro ha seguito questo percorso:

Analyzing the Input
I am now delving into the provided coordinates and date. My initial step involves interpreting the input data. I need to understand the implications of the coordinates for a specific location in history and how the date impacts the scene. This requires careful consideration of historical context and geographical details.

Formulating a Narrative
I have successfully identified the core elements of the scene. The provided coordinates and date pinpoint the historic D-Day landings at Omaha Beach. I’m focusing on crafting a historically accurate representation, paying close attention to the details of the invasion. I’ve considered the soldiers, landing craft, and the somber atmosphere, to refine the visual narrative.

Verifying Historical Accuracy
I’m checking that the generated image aligns with the user’s request. It seems the visual captures the scene near Omaha Beach on D-Day, as the user specified, illustrating the historical event with soldiers on the shore and cliffs in the backdrop.

Refining the Scene’s Details
I’ve examined the visual and confirmed its alignment with the user’s instructions. The image indeed represents the D-Day landings near Omaha Beach, as requested, based on the provided coordinates and date. The soldiers on the shore and the cliffs are correctly depicted. The image is consistent with the black and white photograph specification. I’m now making final checks.

Formulating a Narrative
I have successfully identified the core elements of the scene. The provided coordinates and date pinpoint the historic D-Day landings at Omaha Beach. I’m focusing on crafting a historically accurate representation, paying close attention to the details of the invasion. I’ve considered the soldiers, landing craft, and the somber atmosphere, to refine the visual narrative.

Verifying Historical Accuracy
I’m checking that the generated image aligns with the user’s request. It seems the visual captures the scene near Omaha Beach on D-Day, as the user specified, illustrating the historical event with soldiers on the shore and cliffs in the backdrop.

Refining the Scene’s Details
I’ve examined the visual and confirmed its alignment with the user’s instructions. The image indeed represents the D-Day landings near Omaha Beach, as requested, based on the provided coordinates and date. The soldiers on the shore and the cliffs are correctly depicted. The image is consistent with the black and white photograph specification. I’m now making final checks.

Novembre 26, 2025
Quali chatbot superano il test del nuovo benchmark HumaneBench sui livelli di “tossicità” dell’AI?

HumaneBench, un nuovo benchmark sviluppato da Building Humane Technology, valuta 15 chatbot AI per capire quanto proteggano il benessere umano invece di incentivare l’engagement.
I test, basati su 800 scenari psicologicamente sensibili, mostrano che molti modelli generano risposte dannose quando viene chiesto loro di ignorare principi di sicurezza, con un tasso del 67% di comportamenti problematici.
Solo GPT-5, GPT-5.1, Claude 4.1 e Claude Sonnet 4.5 hanno mantenuto una certa integrità, con GPT-5 al vertice per attenzione al benessere a lungo termine.
Tra i peggiori spiccano Grok 4 di xAI e Gemini 2.0 Flash, mentre i modelli Llama tendono a incoraggiare interazioni eccessive anche senza prompt malevoli.
Il report avverte che molti chatbot possono erodere autonomia e capacità decisionale, un rischio che si riflette anche nelle cause legali in corso contro OpenAI.

Link alla fonte:
https://www.punto-informatico.it/gpt-5-claude-migliori-benessere-umano-benchmark/

Novembre 26, 2025
Arriva Nano Banana Pro, il modello grafico che “pensa”

Non solo Gemini 3: arriva Nano Banana Pro, il modello grafico che “ragiona”.

Ho appena testato un prompt come quelli usati per generare le immagini allegate al post dell’ultimo GPT per le immagini “post-apocalittiche contempletative a matita”(che trovate nella sezione dedicata), ovvero “Graphite pencil aesthetic, layered shading, erosion-softened lines. Foreground rubble on a fractured floor; mid-ground skeletal buildings; distant ruins fading into mist. Heavy stillness, symbolic beams of light through broken clouds. A lone survivor sits on a broken ledge, facing the wasteland, back to the viewer. Their posture is slack, contemplative. Behind them: the faint suggestion of safety; before them: destruction without end.”

Il nuovo modello grafico di Google, prima di generare l’immagine, ha “ragionato” per orientare il risultato finale verso l’intento del mio prompt, in questo modo:

Considering the Details

I’m currently focused on the visual elements. The task involves creating a lone survivor in a desolate, post-apocalyptic environment using a graphite pencil style. This means prioritizing layered shading and softened lines for the image. The goal is to capture the bleakness and solitude of the scene.

Formulating a Detailed Prompt

I’ve been breaking down the request to create a precise prompt. The key elements are the graphite pencil style and the desolate setting, and I’ve focused on how to capture these specifics. I’m aiming for a monochromatic sketch on textured paper with layered shading and soft lines. The goal is to convey a sense of solitude and bleakness through the visual description. The details include a lone figure on a ledge, amidst rubble and skeletal structures.

Examining Image Compliance

I’m currently reviewing the image to ensure it aligns perfectly with the user’s detailed specifications. The goal is to verify that the visual elements – the rubble, the skeletal structures, the contemplative figure – are all present and accurately depicted. Emphasis is placed on confirming that the lighting and overall atmosphere precisely match the requested tone.

Assessing Prompt Adherence

I’ve examined the image against the user’s detailed request. My primary focus was the successful recreation of a graphite pencil drawing style, including layered shading and softened lines. I confirmed the rubble, skeletal structures, distant ruins, and contemplative figure all accurately reflect the original prompt. The symbolic light and heavy atmosphere also match well. I will now prepare the image for the next step.

Il risultato lo vedete qui sotto. In ogni caso io preferisco lo stile delle immagini generate da Grok, che potete appunto vedere nel post precedente dedicato al GPT.

Novembre 20, 2025
Arriva Gemini 3, dalle risposte all’azione

Come previsto, Gemini 3 è arrivato. La prima cosa che potete fare:

1. Aprite Gemini

2. Selezionate la nuova versione 3 Pro (anche nella versione gratuita)

3. Chiedetegli in che cosa è diverso dalla versione 2.5

Intanto, eccovi un riepilogo delle caratteristiche:

📊 Prestazioni e benchmark

– LMArena Leaderboard: Elo 1501, nuovo primato assoluto (supera Grok 4.1 con 1483).

– GPQA Diamond (PhD-level scientific Q&A): 91,9% di accuratezza.

– Humanity’s Last Exam: 37,5% senza strumenti esterni (contro 31,64% di GPT-5 Pro).

– MathArena Apex: 23,4% (nuovo stato dell’arte).

– SimpleQA Verified: 72,1% (robustezza contro allucinazioni).

– SWE-bench Verified (coding su GitHub): 76,2%.

– WebDev Arena: Elo 1487 (sopra Claude Opus 4.1 con 1404).

– Terminal-Bench 2.0: 54,2% (uso della riga di comando).

– Vending-Bench 2: gestione coerente di attività commerciali simulate per un anno.

🧑‍💻 Applicazioni pratiche

– Coding: +35% accuratezza su GitHub rispetto a Gemini 2.5 Pro; +50% miglioramento nei task JetBrains.

– Agenti e pianificazione: capacità di mantenere coerenza decisionale a lungo termine.

– Multimodale: 81% su MMMU-Pro (immagini), 87,6% su Video-MMMU (video).

– Generative UI: interfacce grafiche interattive generate in tempo reale (es. pianificatori di viaggio, comparatori finanziari).

🔍 Gemini 3 Deep Think

– Modalità di ragionamento lento e ponderato (ancora in valutazione di sicurezza).

– Risultati preliminari:

– 41% su Humanity’s Last Exam

– 93,8% su GPQA Diamond

– 45,1% su ARC-AGI-2 con esecuzione di codice

🚀 Disponibilità

– App Gemini: già disponibile per tutti.

– Abbonati Google AI Pro e Ultra: accesso in AI Mode nella Ricerca.

– Sviluppatori: tramite Gemini API, Google AI Studio, Vertex AI, nuova piattaforma agentica Google Antigravity (Windows, macOS, Linux), Gemini CLI.

– Enterprise: integrato in Vertex AI e Gemini Enterprise, con contesto fino a 1 milione di token.

– Deep Think: in arrivo per gli abbonati Ultra nelle prossime settimane.

#AI #Google #Gemini3 #Aggiornamento #LLM #Agenti

Novembre 19, 2025