Vai al contenuto

PANORAMICHE SETTIMANALI
GPTs
Materiali esclusivi per i lettori di “Google AI & Gemini for Dummies”
Prompt ChatGPT for Dummies (nuova edizione)

Tag: Subquadratic

Subquadratic sostiene di aver aggirato il collo di bottiglia dei Transformer

La startup Subquadratic ha presentato SubQ, un’architettura per modelli linguistici che punta a superare uno dei principali limiti dei Transformer: il costo computazionale che cresce quadraticamente con la lunghezza del contesto. Invece di calcolare l’attenzione tra tutti i token, SubQ utilizza una forma di sparse attention dinamica che seleziona solo le parti rilevanti del contesto, consentendo teoricamente di gestire fino a 12 milioni di token con costi drasticamente inferiori. Nei benchmark pubblicati dall’azienda, il modello risulta fino a 56 volte più veloce delle implementazioni basate su FlashAttention e mostra costi operativi enormemente ridotti rispetto ai modelli di fascia alta per contesti molto lunghi. Tuttavia, i risultati derivano principalmente da test controllati, il modello si basa su pesi preaddestrati di Qwen e mancano ancora validazioni indipendenti su larga scala. Se le prestazioni verranno confermate in ambienti reali, l’impatto potrebbe essere significativo per applicazioni enterprise che elaborano grandi quantità di testo, codice e documentazione.

Link alla fonte:
https://www.tomshw.it/business/subquadratic-subq-sparse-attention-llm-bottleneck-2026

Giugno 21, 2026

AI NEWS by BDB

Notizie (e altro) sull'Intelligenza Artificiale

LinkedInProfilo LinkedIn di Bonaventura Di Bello
FacebookPagina Facebook “AI Generativa” di Bonaventura Di Bello
WhatsAppCanale WhatsApp “Te la do io l’Intelligenza Artificiale” di Bonaventura Di Bello
AutoreSito ufficiale dell’autore (Bonaventura ‘BDB’ Di Bello)

Eventi
Negozio
Pattern
Temi

Addestramento Agenti Aggiornamenti AGI AIAct AIAgentica AILocale Allucinazioni Amazon Anthropic Apprendimento Automazione BigTech Bolla Browser Business Chatbot ChatGPT Cina Claude Codex Coding Competizione Concorrenza Contenuti Copyright Cultura Cybersecurity DataCenter Deepfake DeepMind DeepSeek Didattica DirittoDAutore Disinformazione Ecommerce Economia Enterprise Etica Europa Formazione Futuro Gemini Geopolitica Google Grafica Grok Hardware Immagini Infrastrutture Innovazione Investimenti Italia JensenHuang Lavoro Lingue LLM Medicina Mercati Mercato Microsoft Modelli Multimodalità Musica Mythos NanoBanana Normative NotebookLM Nvidia Occupazione OpenAI OpenSource Ottimizzazione Personalizzazione Piattaforme Podcast Produttività Prompt PromptEngineering Regolamentazione Ricerca Risorse Robotica Salute SamAltman Sanità Scenari Scuola Sicurezza Società Strategie Sviluppo Tecnologia Tendenze Update USA UX VibeCoding Video xAI

Twenty Twenty-Five

Progettato con WordPress