USA
3.7.2025

Libri protetti da copyright per addestrare l’IA, fair use e pirateria: ecco cosa ha deciso il tribunale su Meta e Anthropic

In due parole

Un tribunale federale USA ha stabilito che Meta e Anthropic possono utilizzare libri protetti da copyright per addestrare l’intelligenza artificiale (IA), ma Anthropic andrà a processo per aver conservato copie pirata nei suoi server. L’uso di libri per l’addestramento è stato considerato “fair use”, ma l’acquisizione illegale resta un problema legale aperto.

Il caso: addestrare l’IA con libri è legale?

In due cause separate a San Francisco, le aziende Meta e Anthropic sono state citate in giudizio da gruppi di autori per aver usato milioni di libri, molti dei quali ottenuti da fonti illegali, per addestrare i propri modelli IA, Llama e Claude. Gli scrittori rivendicavano la violazione dei diritti d’autore sui loro libri.

Per Anthropic, il giudice William Alsup ha stabilito che l’uso dei testi per addestrare i modelli di IA rientra nel concetto di fair use, ovvero un uso legittimo che non sostituisce né replica le opere originali, ma serve a creare qualcosa di nuovo e trasformativo. In particolare, Alsup ha paragonato l’IA a un “aspirante scrittore” che studia opere esistenti per imparare a scrivere in modo originale. 

Nel caso di Meta, il giudice Vince Chhabria ha respinto la causa intentata dagli autori, ma solo per motivi procedurali: non è stato dimostrato che l’uso dei testi da parte di Meta abbia danneggiato concretamente il mercato editoriale. Tuttavia, ha chiarito che la sentenza non è una dichiarazione di legittimità generale dell’uso fatto da Meta.

Ma i libri erano piratati?

Qui sta la distinzione cruciale: mentre il giudice Alsup ha riconosciuto il diritto di usare i libri per addestrare modelli, ha anche stabilito che l’aver scaricato e conservato oltre 7 milioni di libri piratati costituisce violazione del diritto d’autore. In altre parole, l’uso finale dei dati è stato considerato legittimo, ma il modo in cui sono stati ottenuti no.

Anthropic dovrà quindi affrontare un processo a dicembre per stabilire l’entità dei danni economici causati agli autori.

Cosa cambia per il futuro dell’IA e per gli autori

Queste sentenze rappresentano una vittoria parziale per l’industria dell’IA, che si affida a enormi quantità di dati, spesso ottenuti con metodi discutibili, per addestrare modelli sempre più sofisticati. Secondo le aziende, questi modelli non copiano direttamente i libri, ma ne assorbono strutture linguistiche e informazioni astratte, generando così contenuti “nuovi”.

Per gli autori, però, la prospettiva è molto diversa. I loro testi vengono spesso usati senza consenso, né compenso, per alimentare sistemi che possono generare contenuti direttamente concorrenti a velocità sovrumane. Se il materiale è stato raccolto da archivi pirata (come accade spesso), il danno non è solo economico, ma anche morale.

Le reazioni del pubblico

Le reazioni del pubblico a queste sentenze sono state forti e, in larga parte, negative. Molti commentatori parlano apertamente di furto sistematico, denunciando un sistema legale che sembra proteggere più gli interessi delle grandi aziende che i diritti dei singoli creatori.

Non manca chi difende l’uso legittimo dei dati secondo il principio del fair use, sostenendo che l’addestramento di IA rientri in una pratica accettabile, specialmente se orientata al progresso tecnologico o alla sicurezza nazionale. Ma queste voci sono in minoranza. A dominare è la richiesta di norme più severe: molti chiedono che le aziende di IA paghino per l’uso di opere coperte da copyright e che vengano stabiliti strumenti concreti per garantire trasparenza e consenso.

Ultime Notizie