Anthropic ha introdotto la funzione /goals in Claude Code, un sistema che separa l’agente che esegue il lavoro dal modello che verifica se il compito è davvero completato.
L’obiettivo è risolvere un problema crescente negli agenti AI enterprise: pipeline apparentemente concluse ma con task incompleti, come build non compilate o test non eseguiti.
Il nuovo approccio utilizza un modello valutatore indipendente — di default Haiku — che controlla a ogni ciclo se le condizioni definite dal developer sono state soddisfatte, ad esempio “tutti i test passano” o “git status è pulito”.
A differenza di framework concorrenti come OpenAI, Google ADK o LangChain, Anthropic integra il sistema di valutazione direttamente nel loop dell’agente senza richiedere logiche custom o strumenti esterni di observability.
La novità evidenzia una tendenza più ampia verso agenti AI più verificabili, auditabili e affidabili nei contesti enterprise.
Link alla fonte:
https://venturebeat.com/orchestration/claude-codes-goals-separates-the-agent-that-works-from-the-one-that-decides-its-done
