Tag: Addestramento

  • NVIDIA sotto accusa: uso consapevole di libri piratati per addestrare modelli AI

    Una class action avviata negli Stati Uniti accusa NVIDIA di aver scaricato e utilizzato consapevolmente milioni di libri piratati per addestrare i propri modelli di intelligenza artificiale.
    Secondo i documenti giudiziari aggiornati, l’azienda avrebbe avuto contatti diretti con Anna’s Archive, una nota “shadow library”, nonostante gli avvertimenti sulla natura illegale dei contenuti.
    I testi sarebbero stati impiegati per l’addestramento di modelli come NeMo, Megatron e Nemotron, oltre a essere redistribuiti tramite infrastrutture e framework NVIDIA.
    La causa, che coinvolge anche scrittori noti come Susan Orlean, potrebbe avere forti ripercussioni sull’intero settore IA e riaccendere il dibattito su copyright, fair use e responsabilità nel training dei modelli.

    Link alla fonte:
    https://multiplayer.it/notizie/nvidia-potrebbe-aver-contattato-annas-archive-per-avere-accesso-a-milioni-di-file-di-libri-piratati-per-addestrare-i-suoi-modelli-ia.html

  • Mistral AI sotto accusa: scaricati 70 TB di libri pirata per addestrare modelli AI

    Un’inchiesta di Mediapart ha rivelato che Mistral AI, una delle principali startup europee nel settore dell’intelligenza artificiale, è indirettamente coinvolta in un presunto caso di utilizzo di dati piratati.
    Secondo i documenti giudiziari emersi dal contenzioso “Kadrey v. Meta”, Guillaume Lample, oggi direttore scientifico di Mistral AI, avrebbe coordinato nel 2022 il download di circa 70 terabyte di libri protetti da copyright da Library Genesis mentre lavorava in Meta.
    I file sarebbero stati destinati all’addestramento di modelli linguistici, in un contesto di forte competizione con OpenAI e Google.
    Sebbene Meta non abbia poi utilizzato quei dati per la prima versione di LLaMA, le rivelazioni sollevano dubbi sull’origine dei dataset usati per addestrare Mistral 7B.
    La vicenda assume particolare rilevanza alla luce del nuovo AI Act europeo, che impone trasparenza sulle fonti dei dati di training, obbligo che Mistral AI non ha ancora soddisfatto.

    Link alla fonte:
    https://www.lesnumeriques.com/intelligence-artificielle/mistral-ai-la-licorne-francaise-accusee-par-meta-d-avoir-vole-70-to-de-livres-pour-nourrir-son-ia-n248558.html

  • OpenAI acquisisce Neptune.ai per potenziare il monitoraggio del training dei modelli avanzati

    OpenAI ha annunciato un accordo definitivo per acquisire neptune.ai, piattaforma specializzata nel tracciamento e nell’analisi degli esperimenti di training dei modelli di machine learning.

    L’integrazione punta a migliorare la visibilità in tempo reale sul comportamento dei modelli durante l’addestramento, un elemento cruciale nei processi creativi ed esplorativi del frontier research.

    Neptune ha già collaborato con OpenAI nello sviluppo di strumenti capaci di confrontare migliaia di run, analizzare metriche su più livelli e identificare rapidamente problemi emergenti.

    Secondo Jakub Pachocki, Chief Scientist di OpenAI, la tecnologia di Neptune consente analisi più precise e veloci dei workflow di training, offrendo un vantaggio strategico nell’ottimizzazione dei modelli.

    Per Neptune, l’ingresso in OpenAI rappresenta l’opportunità di offrire le proprie soluzioni su scala globale e contribuire allo sviluppo della prossima generazione di strumenti di addestramento.

    Link alla fonte:
    https://openai.com/index/openai-to-acquire-neptune/