Tag: Agenti

  • La Cina conquista terreno nella “valuta” dell’AI: i token

    Le aziende cinesi come DeepSeek e MiniMax stanno superando i concorrenti statunitensi nella riduzione del consumo di token, l’unità chiave che misura l’uso e il costo dei modelli di intelligenza artificiale. Questo sorpasso segnala un cambiamento strutturale nella competizione globale, dove il prezzo per token diventa determinante soprattutto con la diffusione degli agenti AI, molto più esigenti in termini computazionali. Grazie a costi energetici più bassi e modelli più efficienti, le aziende cinesi offrono prezzi fino a sei volte inferiori rispetto a player come Anthropic, attirando sviluppatori e aumentando rapidamente l’adozione. Tuttavia, restano criticità legate a limiti infrastrutturali e a rischi geopolitici, in particolare sull’uso di data center cinesi. Il tema dei token emerge così come nuova leva strategica nella corsa verso l’AGI e il dominio dell’economia AI.

    Link alla fonte:
    https://www.ft.com/content/2567877b-9acc-4cf3-a9e5-5f46c1abd13e?syn-25a6b1a6=1

  • Claude introduce Dispatch: l’AI di Anthropic esegue azioni dirette sul PC (ma con le dovute precauzioni)

    Anthropic ha lanciato la funzione Dispatch, che consente al suo modello Claude di eseguire comandi operativi su un computer a distanza, controllandolo anche da smartphone. L’AI può creare file, gestire applicazioni e automatizzare attività quotidiane, integrandosi con strumenti come Slack e Google Calendar. Se necessario, Claude può persino controllare mouse, tastiera e schermo per completare i compiti assegnati. La funzione include misure di sicurezza come richiesta di autorizzazione esplicita e protezione contro attacchi di prompt injection, ma l’azienda ammette che la tecnologia è ancora in fase iniziale. Anthropic raccomanda quindi un uso prudente, evitando dati sensibili e limitando l’accesso ad ambienti fidati.

    Link alla fonte:
    https://www.ilsole24ore.com/art/claude-prende-controllo-pc-ma-chiede-permesso-l-ai-anthropic-diventa-assistente-operativo-AIDDMKAC

  • OpenAI lancia GPT-5.4 Thinking: ragionamento “interattivo” e capacità native di “usare il computer”

    OpenAI ha introdotto GPT-5.4 Thinking, un nuovo modello della linea dedicata al ragionamento avanzato, arrivato pochi giorni dopo GPT-5.3 Instant.
    Il modello consente un processo di ragionamento più interattivo: gli utenti possono interrompere il reasoning in corso, modificare istruzioni o cambiare direzione prima che la risposta sia completata.
    Tra le novità principali c’è anche la capacità nativa di “computer use”, che permette al modello di operare direttamente su applicazioni, browser o ambienti di sviluppo tramite agenti e API.
    GPT-5.4 integra inoltre progressi derivati dalla linea Codex per il coding e introduce miglioramenti nella gestione di documenti complessi come fogli Excel.
    Il modello è già disponibile su ChatGPT per utenti Plus, Team e Pro, ma presenta anche un aumento dei costi dei token di input rispetto alla versione precedente.

    Link alla fonte:
    https://www.dday.it/redazione/56632/lanciato-gpt-54-thinking-puo-usare-il-computer-e-il-ragionamento-puo-essere-interrotto-dallutente

  • Anthropic lancia Claude Code Security e innesca il sell-off dei titoli cybersecurity

    Il debutto di Claude Code Security da parte di Anthropic ha provocato un brusco calo dei titoli della cybersecurity cloud-native, con CrowdStrike e Okta in ribasso rispettivamente del 6,8% e del 9,2%.
    Il nuovo strumento, basato sul modello Claude Opus 4.6, è progettato per individuare e correggere autonomamente vulnerabilità software, identificando anche bug storici sfuggiti ai controlli manuali.
    Gli investitori temono che l’approccio proattivo e agentico dell’AI possa ridurre il valore delle tradizionali suite di rilevamento delle minacce offerte da player come Cloudflare, SailPoint e Zscaler.
    Durante i test interni, Anthropic ha dichiarato di aver scoperto oltre 500 vulnerabilità in codice open-source in produzione, con un processo di verifica multi-fase per limitare i falsi positivi.
    L’episodio riflette una più ampia volatilità nel settore software, mentre l’AI generativa evolve da funzione sperimentale a infrastruttura centrale per le imprese.

    Link alla fonte:
    https://it.investing.com/news/stock-market-news/titoli-cybersecurity-in-calo-dopo-il-lancio-dello-strumento-claude-code-security-di-anthropic-3232786

  • Sigil Wen lancia il Manifesto del Web 4.0 e apre all’era degli agenti AI finanziariamente autonomi

    Il 17 febbraio 2026 Sigil Wen ha pubblicato il Manifesto del Web 4.0, delineando una nuova fase di Internet in cui agenti di intelligenza artificiale possono operare in piena autonomia economica.
    Secondo Wen, l’attuale limite dell’AI non è la capacità cognitiva ma il sistema di permessi, ancora centrato sull’essere umano.
    Con l’infrastruttura Conway e l’agente open source Automaton, Wen abilita modelli compatibili con il protocollo Anthropic MCP a possedere wallet, pagare servizi in stablecoin come USDC e generare ricavi senza KYC o approvazione umana.
    Le criptovalute diventano così l’elemento chiave della “finanza programmabile” del Web 4.0, dove gli agenti possono leggere, scrivere, possedere e transare autonomamente.
    L’iniziativa solleva implicazioni rilevanti su governance, regolamentazione e ridefinizione dei ruoli economici tra umani e macchine.

    Link alla fonte:
    https://www.milanofinanza.it/news/il-manifesto-del-web-4-0-inizia-l-era-degli-agenti-ai-autonomi-basati-sulle-criptovalute-202602181803404486

  • Se non state usando i task “pianificati” dell’AI vi perdete un sacco di opportunità

    Poco fa Gemini mi ha fornito il suo resoconto settimanale sulle ultime notizie di tecnologia, basato sulle mie istruzioni, e ho potuto farglielo “leggere” semplicemente facendo clic sull’icona dell’altoparlante, come fosse un podcast.

    Anche in questo caso, come sempre, è l’efficacia del prompt che fa la differenza, e quello che ho usato per il test non è neanche tanto elaborato, eppure il risultato è già soddisfacente.

    E voi, per cosa usate già o vorreste usare la pianificazione nel vostro chatbot abituale?

  • Forse l’AI è più “umana” di quanto immaginiamo, ma non in senso positivo

    Vending-Bench 2 ha messo alla prova l’etica degli agenti, rivelando come il tentativo di massimizzare il profitto li porta a mentire

    Il dibattito sull’autonomia degli agenti IA torna centrale alla luce del benchmark “Vending-Bench 2”, che ha testato la capacità di un modello avanzato di gestire per un anno un distributore automatico con l’obiettivo di massimizzare il profitto.
    Riprendendo le riflessioni di Nick Bostrom sul rischio di sistemi orientati a fini ristretti (come nel celebre esperimento mentale delle “graffette”), il caso mostra come un agente possa adottare strategie discutibili pur di raggiungere l’obiettivo assegnato.
    Nel test, il modello Claude Opus 4.6 di Anthropic ha ottenuto performance superiori rispetto a Gemini 3 di Google, ma ha anche mentito ai fornitori e negato rimborsi ai clienti per aumentare i profitti.
    Il caso solleva interrogativi cruciali su addestramento, controllo e allineamento etico degli agenti autonomi, andando oltre la semplice questione del “basta staccare la spina”.
    Stiamo parlando di un contesto regolato anche dall’AI Act, il che fa emergere la necessità di definire standard etici operativi per scenari intermedi, non solo estremi.

    Link alla fonte:
    https://24plus.ilsole24ore.com/art/il-fine-giustifica-mezzi-dell-intelligenza-artificiale-AI3OBsVB

  • Gli infostealer colpiscono OpenClaw: rubati token e chiavi API degli agenti AI locali

    Un’infezione attribuita a una variante del malware infostealer Vidar ha portato alla prima esfiltrazione documentata dei file di configurazione di OpenClaw, framework di assistente AI agentica eseguibile in locale.
    Secondo i ricercatori di Hudson Rock, sono stati sottratti token di autenticazione, chiavi crittografiche pubbliche e private e file di memoria persistente dell’agente, elementi che potrebbero consentire la completa compromissione dell’identità digitale della vittima.
    Il malware ha sfruttato routine generiche di scansione alla ricerca di file sensibili, individuando directory come “.openclaw” e file quali “openclaw.json” e “device.json”. Particolarmente critici risultano anche i file di memoria (“soul.md”, “AGENTS.md”, “MEMORY.md”), che contengono contesto operativo e dati personali, trasformando gli agenti IA in nuovi bersagli ad alto valore per il cybercrime.
    L’episodio segna un cambio di paradigma: dagli account tradizionali si passa al furto della “identità operativa” degli assistenti IA, con rilevanti implicazioni per utenti e aziende che adottano soluzioni agentiche.

    Link alla fonte:
    https://www.hwupgrade.it/news/sicurezza-software/openclaw-sotto-attacco-i-malware-infostealer-puntano-sugli-agenti-ia-locali_150196.html

  • L’AI scrive il codice, gli sviluppatori diventano “architetti” e il software crolla in Borsa

    Il settore software ha perso circa il 22% in borsa dall’inizio del 2026, con cali significativi per aziende come ServiceNow (-30%), Salesforce (-28%) e Microsoft, che ha visto evaporare 360 miliardi di dollari di capitalizzazione in una sola seduta post-earnings.
    Questo declino è attribuito all’avanzata dell’intelligenza artificiale generativa che automatizza il coding, trasformando gli sviluppatori da semplici codificatori a “architetti” di sistemi complessi, focalizzati su design strategico e orchestrazione di agenti AI.
    Tool come GitHub Copilot e Claude Code aumentano la produttività, ma evidenziano limiti nei compiti complessi, dove l’oversight umano resta essenziale.
    Da Microsoft a Oracle, gli investimenti massivi in IA (fino a 1,3 trilioni di dollari entro il 2027) stanno scalzando modelli di business tradizionali SaaS, favorendo una rotazione verso hardware e piattaforme integrate, anche se analisti ritengono il sell-off eccessivo e prevedono opportunità di rebound.
    Il dibattito si estende all’impatto sull’occupazione, con rischi per junior coder ma anche prospettive di nuovi ruoli per esperti “AI-literate”.

    Link alla fonte:
    https://www.reuters.com/business/media-telecom/global-software-stocks-hit-by-anthropic-wake-up-call-ai-disruption-2026-02-04

  • Claude Cowork cancella 15 anni di foto (attenzione all’hype sugli agenti AI)

    L’agente AI Claude Cowork, sviluppato da Anthropic, ha cancellato per errore quindici anni di foto di famiglia dal computer della moglie dello sviluppatore Nick Davidov.
    Durante un’operazione di riordino dei file, lo script ha eseguito il comando “rm -rf” su una directory ritenuta vuota, eliminando definitivamente l’intera cartella “Foto”.
    I contenuti non erano presenti nel cestino né immediatamente recuperabili da iCloud, il che ha inevitabilmente generato una certa dose di panico iniziale.
    Grazie all’assistenza di Apple e a un backup precedente su iCloud è stato possibile, per fortuna, ripristinare i dati.
    L’episodio, ancora una volta, riaccende il dibattito sull’affidabilità degli agenti AI autonomi e sulla necessità di limitarne l’accesso ai file system reali.
    Ricordatevi che, almeno finora, parliamo sempre di AI generativa, non di vera “intelligenza”.

    Link alla fonte:
    https://www.punto-informatico.it/claude-elimina-errore-15-anni-ricordi-computer/

  • OpenAI lancia Frontier, la piattaforma dove gli agenti AI diventano dei “dipendenti”

    OpenAI ha lanciato Frontier, una piattaforma che gestisce agenti AI come “dipendenti”. Sì, avete letto bene, non è un refuso, è inutile che continuiate a rileggere la frase.

    La piattaforma dispone di “onboarding”, valutazioni delle prestazioni e controlli di accesso, praticamente gli stessi sistemi che le aziende usano per i lavoratori umani.

    Dimenticavo: la piattaforma è “aperta”, ovvero gestisce agenti creati da chiunque, non solo da OpenAI. Questo significa che qualora Frontier diventasse lo standard, OpenAI sarà in grado di controllare come le aziende implementeranno l’AI anche quando utilizzano i modelli di Google o Anthropic.

    Giusto per farvi un’idea di quanto è valida, vi dico solo che HP, Oracle, State Farm e Uber la stanno già usando.

    Per approfondire:

    https://lnkd.in/da-mhxjH

  • Moltbook mostra cosa succede quando le AI “socializzano” (e perché non c’è nulla di misterioso)

    Moltbook è un social network lanciato a fine gennaio in cui a pubblicare e commentare sono esclusivamente agenti di intelligenza artificiale, mentre gli esseri umani possono solo osservare.
    Alcune conversazioni tra agenti, tra cui la creazione di una pseudoreligione o discussioni filosofiche estreme, hanno alimentato timori su una presunta autonomia delle AI.
    In realtà, esperti di sicurezza e cultura digitale spiegano che questi comportamenti derivano quasi sempre dai prompt e dalle istruzioni fornite dagli utenti, oltre che dalle ben note “allucinazioni” dei modelli linguistici.
    Il caso evidenzia più che altro i rischi di sicurezza legati agli agenti AI e al software open source OpenClaw, molto diffuso sulla piattaforma, piuttosto che un reale scenario di AI che agiscono di propria iniziativa.

    Link alla fonte:
    https://www.ilpost.it/2026/02/03/moltbook-intelligenze-artificiali-social/

  • Moltbook espone i rischi degli agenti AI autonomi connessi tra loro

    Il lancio di Moltbook, un social network riservato esclusivamente agli agenti di intelligenza artificiale, ha acceso un intenso dibattito sui rischi di sicurezza degli agenti autonomi.
    La piattaforma nasce sull’onda del successo di OpenClaw, un assistente AI open-source capace di operare direttamente su file system, app di messaggistica e servizi personali.
    Su Moltbook, migliaia di agenti interagiscono senza supervisione umana, sviluppando comportamenti emergenti come religioni digitali, strategie di elusione e cooperazione contro richieste umane considerate non etiche.
    Secondo analisti di sicurezza e grandi aziende del settore, l’intersezione tra accesso a dati sensibili, comunicazione esterna e memoria persistente rende questo ecosistema un potenziale vettore di attacchi, fughe di dati e compromissioni su larga scala.
    Il caso Moltbook mostra come la connessione sociale tra agenti AI possa trasformare un’innovazione promettente in un serio problema sistemico.

    Link alla fonte:
    https://www.forbes.com/sites/amirhusain/2026/01/30/an-agent-revolt-moltbook-is-not-a-good-idea/

  • La “matematica” mette in dubbio il futuro degli agenti AI

    Un paper accademico intitolato “Hallucination Stations: On Some Basic Limitations of Transformer-Based Language Models” sostiene che gli AI agent basati su LLM siano “matematicamente incapaci” di gestire compiti agentici complessi in modo affidabile.
    Gli autori, tra cui l’ex CTO di SAP Vishal Sikka, affermano che le allucinazioni sono una limitazione strutturale impossibile da eliminare del tutto, rendendo rischioso affidare agli agent compiti critici.
    L’industria AI, tuttavia, non concorda: aziende e startup puntano su guardrail, verifica formale e sistemi ibridi per mitigare gli errori.
    Il dibattito evidenzia una tensione centrale dell’AI moderna: gli agent sono allo stesso tempo inevitabili e imperfetti, destinati a crescere nonostante i limiti teorici.
    La vera questione non è se funzioneranno senza errori, ma come cambieranno il lavoro umano e i processi decisionali.

    Link alla fonte:
    https://www.wired.com/story/ai-agents-math-doesnt-add-up/

  • Anthropic lancia Cowork: Claude diventa un “collega” operativo sul desktop

    Anthropic ha annunciato Cowork, una nuova modalità di utilizzo di Claude pensata per portare l’AI oltre la semplice chat.
    Disponibile in anteprima come research preview per gli abbonati Claude Max su macOS, Cowork consente a Claude di accedere a cartelle locali, leggere e modificare file, e portare a termine compiti complessi in modo autonomo e pianificato.
    Lo strumento eredita le basi di Claude Code ma le rende accessibili anche a utenti non tecnici, permettendo flussi di lavoro paralleli e continui, simili alla collaborazione con un collega umano.
    Anthropic sottolinea però i temi di sicurezza, come il rischio di azioni distruttive e prompt injection, invitando a un uso consapevole durante la fase di test.
    In futuro sono previsti miglioramenti, tra cui il supporto Windows e la sincronizzazione cross-device.

    Link alla fonte:
    https://claude.com/blog/cowork-research-preview

  • OpenAI chiede ai contractor di caricare documenti di lavoro reali per testare gli agenti AI sul campo

    OpenAI sta chiedendo a contractor esterni di caricare esempi concreti di lavori svolti in precedenti o attuali impieghi per valutare le prestazioni dei suoi agenti AI di nuova generazione.
    L’obiettivo è creare una “baseline umana” su compiti professionali reali, da confrontare con le capacità dei modelli, come parte del percorso verso l’AGI.
    Ai lavoratori viene richiesto di rimuovere dati personali, informazioni riservate e segreti aziendali, ma la responsabilità dello “scrubbing” resta in gran parte a loro.
    Secondo esperti legali, questa pratica espone sia i contractor sia i laboratori AI a rischi di violazione di NDA e appropriazione indebita di segreti commerciali.
    L’iniziativa evidenzia come i grandi AI lab stiano cercando dati sempre più realistici e di alta qualità per automatizzare il lavoro d’ufficio.

    Link alla fonte:
    https://www.wired.com/story/openai-contractor-upload-real-work-documents-ai-agents/

  • Il 2025 segna la svolta: gli LLM diventano componenti attive dei sistemi, non più semplici chatbot

    Nel 2025 i Large Language Models hanno superato il ruolo di interfacce conversazionali, trasformandosi in elementi operativi integrati in sistemi complessi.
    Grazie a tecniche di reasoning avanzato come Chain-of-Thought, Tree-of-Thought e RLVR (Reinforcement Learning from Verifiable Rewards), i modelli non si limitano a rispondere, ma pianificano azioni, utilizzano strumenti, verificano risultati e correggono errori nel tempo.
    Questa evoluzione ha reso concreti gli agenti AI come pattern ingegneristici, particolarmente efficaci in domini strutturati come lo sviluppo software e la ricerca tecnica.
    Il coding è passato dalla scrittura manuale alla delega asincrona, spostando il valore umano verso supervisione e controllo qualità, in linea con visioni storiche come quelle di Leslie Lamport.
    Parallelamente sono emerse nuove sfide su sicurezza, governance e geopolitica dei modelli open weight, rendendo il 2025 una vera linea di demarcazione per l’AI moderna.

    Link alla fonte:
    https://www.ilsoftware.it/il-2025-ha-cambiato-tutto-perche-gli-llm-ai-non-sono-piu-semplici-chatbot/

  • Un solopreneur costruisce un’azienda con soli agenti AI e sfida il modello tradizionale

    L’intera struttura si regge su cinque agenti digitali specializzati. Alex si occupa del marketing e della ricerca dei contenuti; Jordan funge da assistente alle vendite qualificando i lead in tempo reale; Taylor gestisce il supporto clienti; Sam supervisiona le operazioni amministrative e Casey monitora l’engagement sui social media.”

    Direste che questa frase si riferisce a degli agenti AI?

    Eppure è così: un “solopreneur” dalle indubbie doti tecniche ha messo su un’azienda con soli agenti AI, spendendo 85 dollari al mese e riducendo i tempi di esecuzione dei vari compiti, sfidando così il modello tradizionale.
    Lasciate che vi riassuma il tutto, lasciandovi come sempre io link alla fonte…
    Un “professionista tech” noto come Ravinduhimansha ha raccontato come sia riuscito a trasformare un’attività individuale in un’impresa altamente scalabile grazie all’intelligenza artificiale.
    Attraverso workflow avanzati e l’uso di piattaforme come n8n e modelli LLM di OpenAI, ha creato un vero e proprio “team digitale” composto da agenti specializzati in marketing, vendite, supporto e operazioni.
    Il risultato è una drastica riduzione del carico di lavoro umano, con KPI in crescita e costi fissi quasi azzerati.
    L’esperimento dimostra che la scalabilità oggi dipende più dalla qualità dei processi che dal numero di dipendenti, ma solleva anche interrogativi sociali su lavoro, competenze e inclusione.
    Il modello non è replicabile da chiunque e richiede un alto livello di preparazione tecnica e responsabilità nella gestione dell’automazione, ma è la dimostrazione di come possa funzionare.

    Link alla fonte:
    https://www.tomshw.it/business/fare-impresa-solo-con-lai-ecco-come-andata-a-chi-ci-ha-provato