Un’inchiesta di Mediapart ha rivelato che Mistral AI, una delle principali startup europee nel settore dell’intelligenza artificiale, è indirettamente coinvolta in un presunto caso di utilizzo di dati piratati.
Secondo i documenti giudiziari emersi dal contenzioso “Kadrey v. Meta”, Guillaume Lample, oggi direttore scientifico di Mistral AI, avrebbe coordinato nel 2022 il download di circa 70 terabyte di libri protetti da copyright da Library Genesis mentre lavorava in Meta.
I file sarebbero stati destinati all’addestramento di modelli linguistici, in un contesto di forte competizione con OpenAI e Google.
Sebbene Meta non abbia poi utilizzato quei dati per la prima versione di LLaMA, le rivelazioni sollevano dubbi sull’origine dei dataset usati per addestrare Mistral 7B.
La vicenda assume particolare rilevanza alla luce del nuovo AI Act europeo, che impone trasparenza sulle fonti dei dati di training, obbligo che Mistral AI non ha ancora soddisfatto.
Tag: DirittoDAutore
-
Germania: ChatGPT “condannato” per violazione del copyright su testi musicali
Il tribunale regionale di Monaco di Baviera ha stabilito che ChatGPT ha violato la legge tedesca sul diritto d’autore utilizzando testi di nove canzoni per l’addestramento del modello.
La causa è stata intentata da GEMA, la società tedesca per i diritti musicali, che ha rivendicato la tutela delle opere creative contro l’uso non autorizzato da parte delle piattaforme di intelligenza artificiale.
Il CEO Tobias Holzmueller ha dichiarato che la decisione rappresenta un precedente importante per l’intera industria.
OpenAI ha ribattuto che i propri modelli non memorizzano dati specifici di addestramento e ha annunciato la possibilità di un ricorso.
La sentenza potrebbe avere ripercussioni significative sulle modalità di training dei modelli AI in Europa.Link alla fonte:
https://www.italiaoggi.it/marketing-e-media/media/chatgpt-per-i-giudici-tedeschi-ha-usato-testi-di-canzoni-in-violazione-del-copyright-h9b2uryh -
Getty perde la causa simbolo contro Stability AI: Londra apre un nuovo capitolo sul copyright nell’era dell’AI
L’Alta Corte del Regno Unito ha respinto la causa intentata da Getty Images contro Stability AI, accusata di aver utilizzato milioni di foto protette per addestrare il modello generativo Stable Diffusion.
Il giudice Joanna Smith ha stabilito che un modello di intelligenza artificiale non può essere considerato una “copia” di opere protette, poiché non conserva né riproduce i file originali.
L’unica violazione riconosciuta riguarda l’uso improprio del watermark “Getty” su alcune immagini generate.
La sentenza segna un punto di svolta nel dibattito sul diritto d’autore, legittimando l’addestramento dei modelli di AI su dati protetti quando non vengono riprodotti contenuti identici.
Per il settore creativo è una sconfitta, mentre per l’industria tecnologica rappresenta un’importante conferma di legittimità operativa.
Link alla fonte:
https://www.repubblica.it/tecnologia/2025/11/04/news/ia_e_copyright_getty_perde_causa_simbolo_contro_stability_ai-424958692 -
Aranzulla: “Con l’IA il mio sito perde il 25%, ma il problema è per tutti gli autori del web”
Salvatore Aranzulla, famoso fondatore di Aranzulla.it, denuncia a Fanpage.it un calo del 25% nel traffico del suo sito a causa dell’intelligenza artificiale e delle nuove modalità di ricerca di Google, come Gemini e AI Overview.
L’IA, rielaborando i contenuti originali per fornire risposte dirette agli utenti, riduce drasticamente l’accesso ai siti editoriali e quindi i loro ricavi pubblicitari.
Aranzulla sottolinea che il problema non riguarda solo lui — che dichiara di poter “vivere di rendita” — ma soprattutto collaboratori, autori e giornalisti che dipendono da un ecosistema ormai non sostenibile.
Aranzulla auspica, inoltre, una regolamentazione urgente sul diritto d’autore e propone modelli di compensazione per l’uso dei contenuti da parte delle IA, avvertendo che senza incentivi economici il web rischia di svuotarsi di contenuti di qualità.
L’intervista completa qui:
