Un’inchiesta di Mediapart ha rivelato che Mistral AI, una delle principali startup europee nel settore dell’intelligenza artificiale, è indirettamente coinvolta in un presunto caso di utilizzo di dati piratati.
Secondo i documenti giudiziari emersi dal contenzioso “Kadrey v. Meta”, Guillaume Lample, oggi direttore scientifico di Mistral AI, avrebbe coordinato nel 2022 il download di circa 70 terabyte di libri protetti da copyright da Library Genesis mentre lavorava in Meta.
I file sarebbero stati destinati all’addestramento di modelli linguistici, in un contesto di forte competizione con OpenAI e Google.
Sebbene Meta non abbia poi utilizzato quei dati per la prima versione di LLaMA, le rivelazioni sollevano dubbi sull’origine dei dataset usati per addestrare Mistral 7B.
La vicenda assume particolare rilevanza alla luce del nuovo AI Act europeo, che impone trasparenza sulle fonti dei dati di training, obbligo che Mistral AI non ha ancora soddisfatto.
Tag: Copyright
-
Germania: ChatGPT “condannato” per violazione del copyright su testi musicali
Il tribunale regionale di Monaco di Baviera ha stabilito che ChatGPT ha violato la legge tedesca sul diritto d’autore utilizzando testi di nove canzoni per l’addestramento del modello.
La causa è stata intentata da GEMA, la società tedesca per i diritti musicali, che ha rivendicato la tutela delle opere creative contro l’uso non autorizzato da parte delle piattaforme di intelligenza artificiale.
Il CEO Tobias Holzmueller ha dichiarato che la decisione rappresenta un precedente importante per l’intera industria.
OpenAI ha ribattuto che i propri modelli non memorizzano dati specifici di addestramento e ha annunciato la possibilità di un ricorso.
La sentenza potrebbe avere ripercussioni significative sulle modalità di training dei modelli AI in Europa.Link alla fonte:
https://www.italiaoggi.it/marketing-e-media/media/chatgpt-per-i-giudici-tedeschi-ha-usato-testi-di-canzoni-in-violazione-del-copyright-h9b2uryh -
Getty perde la causa simbolo contro Stability AI: Londra apre un nuovo capitolo sul copyright nell’era dell’AI
L’Alta Corte del Regno Unito ha respinto la causa intentata da Getty Images contro Stability AI, accusata di aver utilizzato milioni di foto protette per addestrare il modello generativo Stable Diffusion.
Il giudice Joanna Smith ha stabilito che un modello di intelligenza artificiale non può essere considerato una “copia” di opere protette, poiché non conserva né riproduce i file originali.
L’unica violazione riconosciuta riguarda l’uso improprio del watermark “Getty” su alcune immagini generate.
La sentenza segna un punto di svolta nel dibattito sul diritto d’autore, legittimando l’addestramento dei modelli di AI su dati protetti quando non vengono riprodotti contenuti identici.
Per il settore creativo è una sconfitta, mentre per l’industria tecnologica rappresenta un’importante conferma di legittimità operativa.
Link alla fonte:
https://www.repubblica.it/tecnologia/2025/11/04/news/ia_e_copyright_getty_perde_causa_simbolo_contro_stability_ai-424958692 -
Universal e Udio: l’industria musicale riprende il controllo sull’IA generativa
Universal e Udio: l’industria musicale riprende il controllo sull’IA generativa
Universal Music Group ha siglato un accordo con la startup Udio, una delle piattaforme di generazione musicale precedentemente accusate di violazione del copyright.
L’intesa, che segue una causa della Recording Industry Association of America, segna un cambio di rotta: Udio ha eliminato la possibilità di scaricare i brani generati dagli utenti e avviato una transizione verso un modello controllato dalle major.
L’obiettivo è creare un ecosistema di IA musicale basato su licenze e consenso esplicito, restituendo agli autori un ruolo nel processo creativo ma limitando la libertà degli utenti indipendenti.
L’accordo con Udio si inserisce in una strategia più ampia che vede Universal e altre etichette storiche stringere alleanze con big tech e startup AI per costruire un’infrastruttura regolata e monetizzata della musica generativa.
Link alla fonte:
https://www.dday.it/redazione/55120/lindustria-musicale-si-mangia-lia-dopo-laccordo-con-universal-udio-elimina-i-download -
Aranzulla: “Con l’IA il mio sito perde il 25%, ma il problema è per tutti gli autori del web”
Salvatore Aranzulla, famoso fondatore di Aranzulla.it, denuncia a Fanpage.it un calo del 25% nel traffico del suo sito a causa dell’intelligenza artificiale e delle nuove modalità di ricerca di Google, come Gemini e AI Overview.
L’IA, rielaborando i contenuti originali per fornire risposte dirette agli utenti, riduce drasticamente l’accesso ai siti editoriali e quindi i loro ricavi pubblicitari.
Aranzulla sottolinea che il problema non riguarda solo lui — che dichiara di poter “vivere di rendita” — ma soprattutto collaboratori, autori e giornalisti che dipendono da un ecosistema ormai non sostenibile.
Aranzulla auspica, inoltre, una regolamentazione urgente sul diritto d’autore e propone modelli di compensazione per l’uso dei contenuti da parte delle IA, avvertendo che senza incentivi economici il web rischia di svuotarsi di contenuti di qualità.
L’intervista completa qui: -
Class action USA contro Anthropic: l’uso non autorizzato di 7 milioni di libri potrebbe portare a risarcimenti miliardari agli autori
Il 17 luglio 2025 il giudice federale William Alsup ha certificato una class action nazionale che permette a tre autori—Andrea Bartz, Charles Graeber e Kirk Wallace Johnson—di rappresentare milioni di scrittori statunitensi i cui libri sarebbero stati scaricati dai siti pirata LibGen e PiLiMi per addestrare il modello Claude di Anthropic. La causa, distinta da un precedente parziale via libera al “fair use” per i testi regolarmente acquistati e digitalizzati, contesta l’archiviazione di circa 7 milioni di opere “piratate” e potrebbe costare all’azienda miliardi di dollari (almeno 750 $ per libro). Il processo sul materiale illegale è fissato per dicembre 2025, mentre il tribunale dovrà quantificare entro il 1 settembre il corpus effettivamente copiato. Il caso stabilisce un precedente cruciale che separa l’uso trasformativo di contenuti legali dalla pirateria e potrebbe influenzare controversie analoghe contro OpenAI, Meta o Microsoft, spingendo l’intero settore IA verso pratiche di licensing più trasparenti.
Link alla fonte:
https://www.spazio50.org/ia-e-copyright-arriva-la-prima-class-action-contro-anthropic/
