Tag: Immagini

  • L’evoluzione di ChatGPT nella generazione grafica

    A volte non ci rendiamo conto di quanto velocemente si stia evolvendo l’AI generativa.

    Stavo preparando, con l’aiuto di ChatGPT, questa immagine da utilizzare in uno dei miei prossimi corsi (la troverete utile sicuramente, che siate formatori i “studenti”), e mi sono accorto che aveva erroneamente collocato nell’angolo in alto a destra l’icona dell’ingranaggio e la voce IMPOSTAZIONI.

    Gli ho segnalato l’errore, e l’ha corretto, ma non mi sarei meravigliato nel veder cambiare l’icona e il testo corrispondenti. Mi sono meravigliato, invece, notando che ha corretto anche l’elenco in basso, di conseguenza, senza che io glie l’avessi chiesto (ero già pronto a dover ripetere l’operazione per essermene dimenticato).

    Ah, se vi state chiedendo come ho ottenuto lo schema presente nell’immagine, ve lo riassumo dicendovi che gli ho fatto analizzare tre schermate di altrettanti chatbot (ChatGPT, Gemini e Claude) chiedendogli di cogliere gli elementi comuni e di inserirli in una immagine nelle posizioni corrispondenti, aggiungendo il testo esplicativo. Dopo avere ottenuto una prima versione stile “wireframe”, gli ho chiesto di applicare lo stile grafico che uso di solito per le mie slide (e che ho usato negli ultimi libri) e di cui tengo sempre a portata di mano la descrizione in inglese.

    Quasi quasi faccio il test con il nuovo Gemini per vedere cosa succede…

  • Dalle infografiche standard a quelle “enciclopediche”

    Oggi vi lascio un prompt con cui potete ottenere delle vere e proprie infografiche stile “enciclopedia” con il nuovo modello grafico di ChatGPT, Images 2.0.

    Sostituite semplicemente l’argomento fra parentesi quadre con quello che desiderate, e ammirate il risultato (vi lascio alcuni esempi dopo il prompt):

    Crea un'infografica verticale premium in stile "enciclopedico" su [ARGOMENTO], con l'aspetto di una pagina tratta da un manuale di storia naturale da collezione, fusa con l'estetica del moderno infographic design editoriale. Il layout deve risultare fortemente strutturato, didattico e modulare — non un poster pubblicitario né un manifesto promozionale.
    Includi: un'immagine principale grande e ultra-dettagliata del soggetto; più riquadri di zoom su dettagli specifici con callout; pannelli informativi con angoli arrotondati; sezioni dedicate a tassonomia e profilo essenziale; schede su comportamento ed ecologia; caratteristiche fisiche; curiosità rapide; moduli di confronto; sistemi di valutazione a icone; grafici sintetici; testo in stile enciclopedico conciso e preciso.
    Sul piano visivo: sfondo chiaro e neutro; palette cromatica sobria e raffinata con ombre leggere; tipografia elegante; piccole icone scientifiche; spaziatura editoriale curata. L'insieme deve combinare alta densità informativa con piena leggibilità.
    Il risultato finale deve somigliare a una scheda di riferimento pubblicabile — della qualità di un pannello museale — progettata per essere collezionata e condivisa sui social media.

    Ecco, infine, alcuni esempi:

  • ChatGPT introduce la “memoria visiva” per generare immagini personalizzate più velocemente

    OpenAI sta sviluppando una nuova funzione per ChatGPT che permetterà di salvare una “foto di riferimento” da riutilizzare automaticamente nella generazione di immagini.
    Questa innovazione elimina la necessità di caricare ogni volta la stessa immagine, semplificando un processo finora ripetitivo.
    La funzione, individuata in una versione beta dell’app Android, introduce il concetto di memoria visiva persistente, migliorando la coerenza tra diverse creazioni.
    Gli utenti potranno gestire liberamente queste immagini salvate, modificandole o eliminandole in qualsiasi momento.
    Se implementata, questa capacità rafforzerebbe l’approccio di un’IA più contestuale e personalizzata, con impatti rilevanti su design, marketing e creazione di contenuti.

    Link alla fonte:
    https://www.infobae.com/tecno/2026/04/17/generar-imagenes-en-chatgpt-sera-mas-rapido-gracias-a-una-funcion-che-guarda-tus-fotos/

  • DuckDuckGo lancia Duck.ai: generazione di immagini AI gratuita e senza account

    L’opzione per attivare Duck.ai nell’app di DuckDuckGo

    DuckDuckGo ha introdotto Duck.ai, un nuovo strumento gratuito di generazione di immagini basato sull’intelligenza artificiale, accessibile direttamente dal motore di ricerca senza necessità di registrazione o tracciamento.
    L’interfaccia è semplice e intuitiva, permettendo di creare e modificare immagini con prompt testuali in pochi secondi.
    L’utente può perfezionare progressivamente i risultati con nuove istruzioni e scaricare i file in formato standard.
    Sebbene presenti limiti giornalieri e meno opzioni avanzate rispetto a Midjourney o DALL-E, Duck.ai si distingue per la privacy, l’accessibilità immediata e la coerenza con la filosofia open e no-tracking di DuckDuckGo.
    È ideale per usi rapidi, brainstorming visivo e contenuti non professionali.

    Link alla fonte:
    https://www.punto-informatico.it/come-generare-immagini-ai-gratis-duckduckgo/

  • FLUX.2 è il nuovo “avversario” di Nano Banana Pro?

    Avete già provato il nuovo FLUX.2? Potete farlo nel playground con qualche decina di immagini gratuite generabili (e ottimi prezzi per i “crediti” nel caso vogliate crearne altre) e risoluzione fino a 2048×2048 pixel.

    Vi allego (in basso) un esempio di immagine alla massima risoluzione e dotata di maggiore realismo, ottenuta con lo stesso prompt (se ricordate, utilizzato per testare Nano Banana Pro qualche giorno fa) aggiungendo, appunto, gli attributi “ultra-realistic photographic” all’inizio della descrizione per evitare l’effetto “sinthetic image” che si nota nello screenshot.

  • Nano Banana Pro è davvero una “macchina del tempo”

    Ho appena testato il prompt “49,3684327, -0,8681529 6 giugno 1944” dopo avere individuato su Google Maps un punto su una delle spiagge della Sbarco in Normandia, ottenendo l’immagine che vedete qui sotto.
    Prima che fosse generata, il nuovo algoritmo di “ragionamento” alla base di Nano Banana Pro ha seguito questo percorso:

    Analyzing the Input
    I am now delving into the provided coordinates and date. My initial step involves interpreting the input data. I need to understand the implications of the coordinates for a specific location in history and how the date impacts the scene. This requires careful consideration of historical context and geographical details.

    Formulating a Narrative
    I have successfully identified the core elements of the scene. The provided coordinates and date pinpoint the historic D-Day landings at Omaha Beach. I’m focusing on crafting a historically accurate representation, paying close attention to the details of the invasion. I’ve considered the soldiers, landing craft, and the somber atmosphere, to refine the visual narrative.

    Verifying Historical Accuracy
    I’m checking that the generated image aligns with the user’s request. It seems the visual captures the scene near Omaha Beach on D-Day, as the user specified, illustrating the historical event with soldiers on the shore and cliffs in the backdrop.

    Refining the Scene’s Details
    I’ve examined the visual and confirmed its alignment with the user’s instructions. The image indeed represents the D-Day landings near Omaha Beach, as requested, based on the provided coordinates and date. The soldiers on the shore and the cliffs are correctly depicted. The image is consistent with the black and white photograph specification. I’m now making final checks.

    Formulating a Narrative
    I have successfully identified the core elements of the scene. The provided coordinates and date pinpoint the historic D-Day landings at Omaha Beach. I’m focusing on crafting a historically accurate representation, paying close attention to the details of the invasion. I’ve considered the soldiers, landing craft, and the somber atmosphere, to refine the visual narrative.

    Verifying Historical Accuracy
    I’m checking that the generated image aligns with the user’s request. It seems the visual captures the scene near Omaha Beach on D-Day, as the user specified, illustrating the historical event with soldiers on the shore and cliffs in the backdrop.

    Refining the Scene’s Details
    I’ve examined the visual and confirmed its alignment with the user’s instructions. The image indeed represents the D-Day landings near Omaha Beach, as requested, based on the provided coordinates and date. The soldiers on the shore and the cliffs are correctly depicted. The image is consistent with the black and white photograph specification. I’m now making final checks.

  • Meta usa Midjourney per le sue immagini (e video)?

    Avete già provato la generazione di immagini e video di Meta?

    Siamo ormai così “abituati” al fatto che il chatbot e la corrispondente AI di Meta sia inaccessibile dall’Europa (e di conseguenza dall’Italia) che magari dimentichiamo di provare ad accedere (col nostro account Facebook/Instagram) o registrarci con nuovo account.

    Nel frattempo, oltre alla potenza del modello di testo, la qualità delle immagini e dei video generabili sulla piattaforma si è evoluta a tal punto da somigliare a quella di Midjourney.

    Lo screenshot dovrebbe dare un’idea…

  • Arriva Nano Banana Pro, il modello grafico che “pensa”

    Non solo Gemini 3: arriva Nano Banana Pro, il modello grafico che “ragiona”.

    Ho appena testato un prompt come quelli usati per generare le immagini allegate al post dell’ultimo GPT per le immagini “post-apocalittiche contempletative a matita”(che trovate nella sezione dedicata), ovvero “Graphite pencil aesthetic, layered shading, erosion-softened lines. Foreground rubble on a fractured floor; mid-ground skeletal buildings; distant ruins fading into mist. Heavy stillness, symbolic beams of light through broken clouds. A lone survivor sits on a broken ledge, facing the wasteland, back to the viewer.  Their posture is slack, contemplative.  Behind them: the faint suggestion of safety; before them: destruction without end.”

    Il nuovo modello grafico di Google, prima di generare l’immagine, ha “ragionato” per orientare il risultato finale verso l’intento del mio prompt, in questo modo:

    Considering the Details

    I’m currently focused on the visual elements. The task involves creating a lone survivor in a desolate, post-apocalyptic environment using a graphite pencil style. This means prioritizing layered shading and softened lines for the image. The goal is to capture the bleakness and solitude of the scene.

    Formulating a Detailed Prompt

    I’ve been breaking down the request to create a precise prompt. The key elements are the graphite pencil style and the desolate setting, and I’ve focused on how to capture these specifics. I’m aiming for a monochromatic sketch on textured paper with layered shading and soft lines. The goal is to convey a sense of solitude and bleakness through the visual description. The details include a lone figure on a ledge, amidst rubble and skeletal structures.

    Examining Image Compliance

    I’m currently reviewing the image to ensure it aligns perfectly with the user’s detailed specifications. The goal is to verify that the visual elements – the rubble, the skeletal structures, the contemplative figure – are all present and accurately depicted. Emphasis is placed on confirming that the lighting and overall atmosphere precisely match the requested tone.

    Assessing Prompt Adherence

    I’ve examined the image against the user’s detailed request. My primary focus was the successful recreation of a graphite pencil drawing style, including layered shading and softened lines. I confirmed the rubble, skeletal structures, distant ruins, and contemplative figure all accurately reflect the original prompt. The symbolic light and heavy atmosphere also match well. I will now prepare the image for the next step.

    Il risultato lo vedete qui sotto. In ogni caso io preferisco lo stile delle immagini generate da Grok, che potete appunto vedere nel post precedente dedicato al GPT.

  • Un GPT per generare immagini post-apocalittiche “contemplative” disegnate a matita

    Le immagini che vedete qui sotto sono state generate partendo da un prompt strutturato intorno al concetto di “scena post-apocalittica contemplativa”, disegnata a matita.

    Il “template” di partenza segue più o meno questa struttura:

    • STYLE: graphite pencil drawing, detailed shading, rough grain texture, soft eroded edges  
    • SCENE: layered ruins (foreground debris, mid-ground collapsed structures, background haze)  
    • LIGHTING: heavy atmospheric gloom, diffused highlights, symbolic light source  
    • MOOD: contemplative, melancholic, quiet aftermath, emotional weight  
    • FIGURE: [choose Isolated Sentinel / Boundary Meditation / Celestial Witness]  
    • COMPOSITION: wide shot, strong depth, negative space emphasized  
    • DETAILING: hand-drawn imperfections, subtle cross-hatch, charcoal smudging

    Partendo da questo concetto, ho generato un GPT interattivo, capace di guidare l’utente nella costruzione passo-passo di descrizioni che potessero appunto generare scene post-apocalittiche “contemplative” in stile disegno a matita.

    Il GPT è stato progettato per essere usabile, non solo “descrittivo”, infatti:

    – guida l’utente con domande brevi e mirate

    – costruisce il prompt incrementale

    – permette di modificare, rigenerare, esportare

    – integra i tre stili (Isolated Sentinel, Boundary Meditation, Celestial Witness) come “moduli”

    – ricostruisce il prompt finale in formato standard, extended o ultra-rigido

    Il GPT si chiama “Apocalyptic Pencil Art Prompt Builder” ed è raggiungibile, oltre che con la ricerca, da questo link:

    https://chatgpt.com/g/g-691f3dc4b5608191ac0876978ac2c78b-apocalyptic-pencil-art-prompt-builder

    Se vi va di provarlo e postare i vostri risultati nei commenti, siete i benvenuti.

    P.S. Hai già dato un’occhiata al mio libro “AI Art. Grafica professionale con l’intelligenza artificiale generativa”? Lo trovi in tutte le librerie (fisiche e virtuali) e, ovviamente, su Amazon (https://amzn.to/4pgUdFb)

  • Algoritmi generativi che creano infiniti mondi spettacolari?

    Sì, ed è l’unica definizione che riesco a dare a quanto sto osservando da un po’ di tempo, dopo aver scoperto i video di YouTube che utilizzano scenari chiaramente generati dall’AI e poi animati, collocati in sequenza e utilizzati come sfondo visuale a una colonna sonora di un genere “affine” che dura un’ora o più.

    Per esempio, scenari post-apocalittici o cosmici con sottofondo ambient, scenari fantasy con sottofondo di musiche medioevali o celtiche, e così via (ci sono anche scenari fissi, ovvero dove la scena pur se animata rimane sempre la stessa, per esempio deliziosi angoli naturali o urbani con sottofondo jazz, e così via).

    Vi lascio, come esempio, in fondo al post uno dei tanti video che ho guardato nell’ultimo periodo per rilassarmi fra una sessione di lavoro e l’altra. Il video fa parte del canale VIATMOS, che vi consiglio in quanto uno dei migliori per questo genere.

    Naturalmente, data la mia passione per l’AI e sapendo che questi scenari nascono proprio da algoritmi generativi, non ho resistito e ho fatto analizzare alcuni fotogrammi del video in questione, in modo che l’AI potesse analizzarne le caratteristiche comuni, per poi trasformare questa analisi in un prompt e infine in un GPT, che porta il titolo di “Ethereal Megastructures Prompt Generator” e che trovate, come sempre, nell’ecosistema dei GPT di OpenAI.

    Il GPT vi genera delle descrizioni “a tema” pronte per l’uso, che potrete quindi “dare in pasto” a qualsiasi AI generativa in grado di creare delle immagini (ChatGPT, Gemini, Copilot, Grok, ecc.), comprese quelle disponibili in LM Arena.

    P.S. Come sempre, se avete bisogno di sviluppare da zero oppure ottimizzare un prompt per le vostre esigenze, o creare un GPT o un GEM corrispondente, contattatemi su LinkedIn. Se, invece, vi interessa in modo particolare la generazione professionale di immagini con l’AI, date un’occhiata al mio libro “AI Art. Grafica professionale con l’intelligenza artificiale generativa” (lo trovate in tutte le librerie fisiche e online).

  • Microsoft lancia MAI-Image-1, il suo primo generatore di immagini AI sviluppato internamente

    Microsoft AI ha presentato MAI-Image-1, il primo generatore di immagini testuale sviluppato interamente in-house.

    Il modello, parte della nuova linea di prodotti MAI insieme a MAI-Voice-1 e MAI-1-preview, segna un passo strategico verso l’indipendenza tecnologica di Microsoft nel campo dell’intelligenza artificiale.

    Progettato con il contributo di professionisti creativi, il sistema punta a evitare risultati ripetitivi o stilisticamente generici, eccellendo nella creazione di immagini fotorealistiche come paesaggi e fenomeni naturali.

    MAI-Image-1 è già entrato nella top 10 di LMArena, piattaforma di benchmarking per modelli di generazione visiva, e promette tempi di elaborazione più rapidi rispetto ai modelli di grandi dimensioni.

    L’azienda ha inoltre ribadito l’impegno verso pratiche di sviluppo responsabile e sicuro.

    Link alla fonte:

    Microsoft AI announces first image generator created in-house | The Verge