Tag: Opus

  • Claude continua a evolversi

    Non solo nei modelli, anche nella loro “calibrazione”.

    L’arrivo del nuovo Opus 4.8 si affianca alle quattro opzioni di “potenza” utilizzabili anche per il modello intermedio Sonnet (vedi screenshot).

    Fate solo attenzione tanto a selezionare quanto a calibrare il modello a seconda dei task da eseguire, perché i limiti di utilizzo si raggiungono sempre più facilmente.

    A proposito del nuovo Opus, ecco cosa dice Anthropic nel suo comunicato ufficiale (sotto trovate il link):

    Uno dei miglioramenti più evidenti dell’Opus 4.8 è la sua onestà. Addestriamo tutti i nostri modelli a essere onesti — ad esempio, per evitare affermazioni che non possono sostenere. Ma un problema generale dei modelli di IA è che a volte saltano a conclusioni affrettate, affermando con sicurezza di aver fatto progressi nel loro lavoro nonostante le prove siano scarse. I primi tester riportano che Opus 4.8 è più propenso a segnalare incertezze sul suo lavoro e meno a fare affermazioni non supportate. Ciò è confermato dalle nostre valutazioni, che mostrano che Opus 4.8 è circa quattro volte meno propenso rispetto al suo predecessore a permettere che difetti nel codice scritto passino inosservati.

    https://www.anthropic.com/news/claude-opus-4-8

  • Claude Opus 4.7 di Anthropic non è solo un upgrade, è un vero “collega di lavoro”

    Come sapete ieri (16 aprile 2026) Anthropic ha lanciato il suo nuovo modello “pubblico” più potente, Claude Opus 4.7.
    Ecco una sintesi chiara e ufficiale delle 7 novità principali, tratte direttamente dall’annuncio e dalla documentazione tecnica di Anthropic.

    1. Molto più efficiente sui compiti difficili: gestisce coding complesso e task agentici a lungo termine con rigore e autonomia. Controlla da solo il proprio lavoro, verifica gli errori e riduce drasticamente la necessità di supervisione. Basso sforzo su Opus 4.7 ≈ medio sforzo su 4.6.

    2. Una “vista più acuta” (visione 3x più potente): per la prima volta un supporto all’alta risoluzione: fino a 2576 px / 3,75 MP (oltre 3 volte i modelli precedenti). Legge alla perfezione screenshot caotici, diagrammi minuscoli, strutture chimiche e documenti complessi.

    3. Ricorda “come te”: migliora l’uso della memoria basata su file system: scrive note a se stesso, riprende esattamente da dove aveva lasciato anche dopo giorni di lavoro, senza dover rispiegare tutto.

    4. Un lavoratore più intelligente: top di gamma su task finanziari, legali e d’ufficio. Produce slide deck più puliti, report più precisi e interfacce più professionali. Migliora del 21% nella comprensione di documenti d’ufficio rispetto a 4.6.

    5. Tu resti al comando: nuovo livello di sforzo “xhigh” (tra high e max) per calibrare precisione vs velocità, e “task budget” (in beta) che limitano i token spesi nelle sessioni lunghe. L’AI si auto-monitora e ottimizza.

    6. Sicurezza cyber rafforzata: blocca automaticamente richieste di hacking o uso malevolo. Introduce il Cyber Verification Program: solo professionisti della sicurezza verificati possono accedere a certe funzionalità. È il primo modello con capacità “cyber” ridotte rispetto al modello Mythos Preview per maggiore sicurezza.

    7. Stesso prezzo, più potenza: prezzi invariati: $5 per milione di token input, $25 per milione di output. Il nuovo tokenizer rende il testo leggermente più “costoso” (fino a 1,35x token), ma l’efficienza complessiva è nettamente superiore.

    Volendo sintetizzare il tutto, potremmo dire che Opus 4.7 è progettato per essere autonomo, affidabile e pronto per il “lavoro reale” (coding agentico, knowledge work, task multi-giornata). Il nuovo modello e già disponibile su claude.ai, Claude Platform, AWS Bedrock, Google Vertex AI e Microsoft Foundry.

    Link alla documentazione ufficiale:
    https://platform.claude.com/docs/en/about-claude/models/whats-new-claude-4-7