Nel caso abbiate ancora dubbi sull’intelligenza e sulla capacità di comprensione dell’AI “generativa”, vi mostro l’ennesima prova che questi elementi, in sostanza, non esistono.
Si chiama “AI generativa” perché i modelli su cui si basa attualmente si limitano a generare contenuti seguendo pattern statistici, quindi anche quando vedere un “ragionamento” state osservando una fila di parole infilate una dopo l’altra secondo una serie di calcoli di affinità verbale dell’algoritmo (costruita durante l’addestramento).
La prova finale: un gruppo di ricercatori ha sottoposto ai modelli di fascia alta di ChatGPT e Gemini una serie di problemi che avevano risolto ma mai pubblicato (di conseguenza l’AI non poteva avere acquisito dei dati dalla loro “lettura”, che peraltro deve riguardare elementi individuati con una certa frequenza per ottenere la sua “attenzione”), e il risultato è stato che nessuno dei due modelli di punta è stato in grado di risolverli.
Si continua a parlare di AGI, di “agenti”, di “decisioni” da parte dell’AI e di sostituzione dell’essere umano, ma come ho spesso sottolineato finché non cambieranno gli algoritmi possiamo dimenticarci una vera “intelligenza” che dovrebbe essere alla base di tali scenari.
Amazon sta adottando su larga scala l’AI neuro-simbolica per rendere i sistemi di intelligenza artificiale più affidabili, verificabili e adatti a decisioni critiche. Questo approccio combina l’apprendimento statistico dei modelli neurali con il rigore logico dell’AI simbolica, consentendo alle macchine di spiegare e dimostrare i propri ragionamenti. La tecnologia è già utilizzata in applicazioni operative come robot di magazzino, assistenti allo shopping e sistemi di sicurezza per la generative AI su Amazon Web Services. Con il nuovo modello di ragionamento Nova 2 Lite, Amazon integra il reasoning automatizzato direttamente nel training dei modelli, puntando a ridurre le allucinazioni e ad abilitare l’uso dell’AI in contesti ad alta responsabilità come compliance, finanza e decisioni strategiche.
Non solo Gemini 3: arriva Nano Banana Pro, il modello grafico che “ragiona”.
Ho appena testato un prompt come quelli usati per generare le immagini allegate al post dell’ultimo GPT per le immagini “post-apocalittiche contempletative a matita”(che trovate nella sezione dedicata), ovvero “Graphite pencil aesthetic, layered shading, erosion-softened lines. Foreground rubble on a fractured floor; mid-ground skeletal buildings; distant ruins fading into mist. Heavy stillness, symbolic beams of light through broken clouds. A lone survivor sits on a broken ledge, facing the wasteland, back to the viewer. Their posture is slack, contemplative. Behind them: the faint suggestion of safety; before them: destruction without end.”
Il nuovo modello grafico di Google, prima di generare l’immagine, ha “ragionato” per orientare il risultato finale verso l’intento del mio prompt, in questo modo:
Considering the Details
I’m currently focused on the visual elements. The task involves creating a lone survivor in a desolate, post-apocalyptic environment using a graphite pencil style. This means prioritizing layered shading and softened lines for the image. The goal is to capture the bleakness and solitude of the scene.
Formulating a Detailed Prompt
I’ve been breaking down the request to create a precise prompt. The key elements are the graphite pencil style and the desolate setting, and I’ve focused on how to capture these specifics. I’m aiming for a monochromatic sketch on textured paper with layered shading and soft lines. The goal is to convey a sense of solitude and bleakness through the visual description. The details include a lone figure on a ledge, amidst rubble and skeletal structures.
Examining Image Compliance
I’m currently reviewing the image to ensure it aligns perfectly with the user’s detailed specifications. The goal is to verify that the visual elements – the rubble, the skeletal structures, the contemplative figure – are all present and accurately depicted. Emphasis is placed on confirming that the lighting and overall atmosphere precisely match the requested tone.
Assessing Prompt Adherence
I’ve examined the image against the user’s detailed request. My primary focus was the successful recreation of a graphite pencil drawing style, including layered shading and softened lines. I confirmed the rubble, skeletal structures, distant ruins, and contemplative figure all accurately reflect the original prompt. The symbolic light and heavy atmosphere also match well. I will now prepare the image for the next step.
Il risultato lo vedete qui sotto. In ogni caso io preferisco lo stile delle immagini generate da Grok, che potete appunto vedere nel post precedente dedicato al GPT.