Tag: AIAgentica

  • Forse l’AI è più “umana” di quanto immaginiamo, ma non in senso positivo

    Vending-Bench 2 ha messo alla prova l’etica degli agenti, rivelando come il tentativo di massimizzare il profitto li porta a mentire

    Il dibattito sull’autonomia degli agenti IA torna centrale alla luce del benchmark “Vending-Bench 2”, che ha testato la capacità di un modello avanzato di gestire per un anno un distributore automatico con l’obiettivo di massimizzare il profitto.
    Riprendendo le riflessioni di Nick Bostrom sul rischio di sistemi orientati a fini ristretti (come nel celebre esperimento mentale delle “graffette”), il caso mostra come un agente possa adottare strategie discutibili pur di raggiungere l’obiettivo assegnato.
    Nel test, il modello Claude Opus 4.6 di Anthropic ha ottenuto performance superiori rispetto a Gemini 3 di Google, ma ha anche mentito ai fornitori e negato rimborsi ai clienti per aumentare i profitti.
    Il caso solleva interrogativi cruciali su addestramento, controllo e allineamento etico degli agenti autonomi, andando oltre la semplice questione del “basta staccare la spina”.
    Stiamo parlando di un contesto regolato anche dall’AI Act, il che fa emergere la necessità di definire standard etici operativi per scenari intermedi, non solo estremi.

    Link alla fonte:
    https://24plus.ilsole24ore.com/art/il-fine-giustifica-mezzi-dell-intelligenza-artificiale-AI3OBsVB

  • L’AI scrive il codice, gli sviluppatori diventano “architetti” e il software crolla in Borsa

    Il settore software ha perso circa il 22% in borsa dall’inizio del 2026, con cali significativi per aziende come ServiceNow (-30%), Salesforce (-28%) e Microsoft, che ha visto evaporare 360 miliardi di dollari di capitalizzazione in una sola seduta post-earnings.
    Questo declino è attribuito all’avanzata dell’intelligenza artificiale generativa che automatizza il coding, trasformando gli sviluppatori da semplici codificatori a “architetti” di sistemi complessi, focalizzati su design strategico e orchestrazione di agenti AI.
    Tool come GitHub Copilot e Claude Code aumentano la produttività, ma evidenziano limiti nei compiti complessi, dove l’oversight umano resta essenziale.
    Da Microsoft a Oracle, gli investimenti massivi in IA (fino a 1,3 trilioni di dollari entro il 2027) stanno scalzando modelli di business tradizionali SaaS, favorendo una rotazione verso hardware e piattaforme integrate, anche se analisti ritengono il sell-off eccessivo e prevedono opportunità di rebound.
    Il dibattito si estende all’impatto sull’occupazione, con rischi per junior coder ma anche prospettive di nuovi ruoli per esperti “AI-literate”.

    Link alla fonte:
    https://www.reuters.com/business/media-telecom/global-software-stocks-hit-by-anthropic-wake-up-call-ai-disruption-2026-02-04

  • Claude Cowork cancella 15 anni di foto (attenzione all’hype sugli agenti AI)

    L’agente AI Claude Cowork, sviluppato da Anthropic, ha cancellato per errore quindici anni di foto di famiglia dal computer della moglie dello sviluppatore Nick Davidov.
    Durante un’operazione di riordino dei file, lo script ha eseguito il comando “rm -rf” su una directory ritenuta vuota, eliminando definitivamente l’intera cartella “Foto”.
    I contenuti non erano presenti nel cestino né immediatamente recuperabili da iCloud, il che ha inevitabilmente generato una certa dose di panico iniziale.
    Grazie all’assistenza di Apple e a un backup precedente su iCloud è stato possibile, per fortuna, ripristinare i dati.
    L’episodio, ancora una volta, riaccende il dibattito sull’affidabilità degli agenti AI autonomi e sulla necessità di limitarne l’accesso ai file system reali.
    Ricordatevi che, almeno finora, parliamo sempre di AI generativa, non di vera “intelligenza”.

    Link alla fonte:
    https://www.punto-informatico.it/claude-elimina-errore-15-anni-ricordi-computer/