Tag: Ottimizzazione

  • Claude Code scopre autonomamente nuovi algoritmi di scaling AI più efficienti

    Un team di ricerca composto da università statunitensi insieme a Google e Meta ha sviluppato AutoTTS, un framework che permette a un agente AI di progettare autonomamente algoritmi di test-time scaling (TTS), invece di affidarsi a strategie scritte manualmente dai ricercatori. Utilizzando Anthropic Claude Code come agente di ricerca, il sistema ha esplorato migliaia di strategie in un ambiente simulato offline, riducendo drasticamente i costi computazionali della sperimentazione. L’algoritmo generato dall’AI ha ottenuto migliori rapporti accuratezza/compute rispetto a metodi consolidati come la self-consistency, arrivando a ridurre del 70% il consumo di token mantenendo prestazioni competitive su benchmark matematici come AIME e HMMT.
    Il risultato suggerisce un cambio di paradigma nella ricerca AI: gli esseri umani non progettano più direttamente gli algoritmi, ma costruiscono ambienti di ricerca nei quali le AI scoprono autonomamente strategie emergenti difficili da concepire manualmente.
    Il lavoro si inserisce nella stessa direzione di progetti come Google DeepMind FunSearch e AlphaEvolve, rafforzando l’idea di sistemi AI capaci di auto-ottimizzare il proprio processo di miglioramento.

    Link alla fonte:
    https://the-decoder.com/researchers-let-claude-code-discover-ai-scaling-algorithms-that-humans-probably-wouldnt-have-designed/

  • Claude: meglio tenere le Skill esterne in un file .md?

    Le Skill di Anthropic per Claude sono funzionalità personalizzate simili ai GPT di OpenAI o alle Gem di Google, ma con un comportamento diverso.
    Claude analizza automaticamente tutte le Skill salvate internamente ogni volta che riceve un prompt, attivandole se le ritiene rilevanti.
    Questo può causare una perdita di controllo, soprattutto quando si accumulano molte Skill.
    Utilizzare file esterni in formato Markdown (.md) permette invece di attivarle solo quando necessario, allegandole manualmente.
    In questo modo si ottiene maggiore precisione, controllo e modularità nell’uso dell’AI.

    Link alla fonte:
    https://www.xataka.com/basics/skills-externas-archivos-md-claude-que-util-tenerlas-como-crearlas-como-usarlas/amp

  • TurboQuant di Google rivoluziona la “compressione AI” riducendo memoria e costi senza perdita di precisione

    I ricercatori di Google Research presentano TurboQuant, un nuovo algoritmo di quantizzazione progettato per comprimere drasticamente i modelli AI senza perdita di accuratezza.

    La tecnica combina due innovazioni — QJL e PolarQuant — per ridurre fino a 6 volte la memoria del key-value cache, migliorando al contempo velocità e prestazioni nei modelli linguistici.

    TurboQuant riesce a operare con rappresentazioni a soli 3 bit mantenendo risultati equivalenti ai modelli non compressi, con accelerazioni fino a 8x su GPU.

    Questo approccio ha implicazioni cruciali per il futuro della ricerca semantica e degli LLM su larga scala, rendendo possibile gestire enormi quantità di dati con maggiore efficienza. Il lavoro, che sarà presentato a ICLR 2026 e AISTATS 2026, rappresenta un avanzamento teorico e pratico nella compressione vettoriale.

    Link alla fonte:

    https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression

  • Anthropic potenzia Claude Sonnet 4.6 con 1 milione di token e focus sul coding

    Anthropic ha rilasciato Claude Sonnet 4.6, aggiornando il modello intermedio della famiglia Claude a poche settimane dal debutto di Claude Opus 4.6.
    La novità principale è l’introduzione, in beta, di una finestra di contesto fino a un milione di token, che consente di analizzare interi codebase, contratti o raccolte di paper in un’unica richiesta.
    Il modello migliora inoltre nelle attività di coding, nell’aderenza alle istruzioni e nell’uso del computer, ottenendo risultati di rilievo in benchmark come SWE-Bench, OS World e ARC-AGI-2.
    Pur restando dietro a modelli più grandi come Gemini 3 Deep Think e una versione ottimizzata di GPT-5.2, Sonnet 4.6 si propone come il miglior compromesso tra prestazioni e costi per utenti Free e Pro.

    Link alla fonte:
    https://www.punto-informatico.it/claude-sonnet-4-6-coding-migliore-finestra-contesto-enorme/

  • Verso modelli linguistici più “culturali”: meno parametri, più efficienza

    Negli ultimi anni, lo sviluppo dei modelli linguistici ha segnato un cambiamento di rotta, privilegiando l’efficienza e la qualità dell’addestramento rispetto alla sola crescita dei parametri. L’architettura Transformer del 2017 ha aperto la strada, ma oggi l’attenzione si concentra su modelli più piccoli – i cosiddetti Small Language Models (SLM) – e su metodologie di training più sofisticate. I tre filoni chiave dell’innovazione sono la multimodalità, l’interazione con strumenti esterni e l’ottimizzazione delle tecniche di apprendimento. La nuova sfida consiste nel bilanciare struttura e cultura, puntando su un’intelligenza artificiale meno energivora ma altrettanto performante.

    Link alla fonte:
    https://24plus.ilsole24ore.com/art/le-nuove-strategie-sviluppo-ai-piu-cultura-che-dimensioni-modelli-AHpoirpB

  • Algoritmi speculativi accelerano i modelli linguistici fino a 3 volte

    Un team di ricercatori del Weizmann Institute, Intel Labs e d-Matrix ha sviluppato algoritmi innovativi di “speculative decoding” per accelerare l’inferenza dei modelli linguistici fino a 2,8 volte senza perdita di qualità. Presentati all’ICML, gli algoritmi SLEM, TLI e SLRS eliminano la necessità di condividere il vocabolario tra modelli, migliorando l’efficienza del processo. SLEM, già adottato come default in Hugging Face, rappresenta una soluzione plug-and-play per ottimizzare le performance AI. La ricerca apre nuove prospettive per modelli più veloci e flessibili, anche su hardware meno potente.

    Link alla fonte:
    https://www.hwupgrade.it/news/web/modelli-linguistici-fino-a-3-volte-piu-veloci-non-serve-avere-una-mega-gpu_141232.html