Il training dell’intelligenza artificiale mette a rischio i diritti degli autori
L’allenamento degli algoritmi richiede il caricamento dal web di un’enorme mole di dati. L'utilizzo delle opere tutelate per legge non è lecito ma impedirlo è difficile
di Gianluca De Cristofaro e Miriam Loro Piana
3' di lettura
Ai sistemi di intelligenza artificiale (Ai) generativa va insegnato come comprendere le richieste degli utenti, fornire risposte e prendere decisioni. Lo sviluppo e il miglioramento degli algoritmi dipende infatti dalla quantità e dalla tipologia di dati che raccolgono ed elaborano per “imparare”. I sistemi di Ai hanno cioè bisogno di “allenarsi” e per farlo devono continuamente acquisire ed elaborare una enorme mole di dati/contenuti che vengono per la maggior parte acquisiti dal web.
Ma la disponibilità di un contenuto su Internet non vuol dire che questo possa essere liberamente utilizzato, soprattutto se è oggetto di diritti di esclusiva come, ad esempio, le opere tutelate dal diritto d’autore (libri, canzoni, fotografie, immagini di opere dell’arte figurativa, eccetera).
Il web scraping
La raccolta di dati avviene attraverso il cosiddetto web scraping, ovvero un processo attraverso il quale una applicazione consulta simultaneamente un numero elevato di fonti online, estraendo le informazioni con l’obiettivo poi di classificarle in base alle loro caratteristiche, suddividerle per categorie e archiviarle all’interno di un database.
L’attività di web scraping è considerata lecita a patto che vengano rispettate due condizioni:
- l’attività di interrogazione deve avere ad oggetto dati destinati alla pubblica consultazione;
- non devono essere violati diritti di proprietà industriale ed intellettuale di soggetti terzi.
Tali diritti di privativa possono riguardare sia il singolo dato/contenuto, tutelato di per sé quale opera del diritto d’autore, sia la fonte da cui i dati vengono estratti qualora quest’ultima consista in una banca dati protetta dalla cosiddetta tutela sui generis prevista dalla legge sul diritto d’autore (si veda l’articolo a fianco).
Il diritto d’autore
Sotto un profilo tecnico, la sola acquisizione di un contenuto tutelato dal diritto d’autore per il training dell’Ai, implica la riproduzione (seppur temporanea) del contenuto stesso.
Anche in mancanza di specifiche decisioni dei tribunali italiani, si deve comunque ritenere che l’utilizzo di contenuti tutelati dal diritto d’autore per “allenare” i sistemi di Ai possa costituire di per sé un atto di riproduzione di cui all’articolo 13 legge diritto d’autore, per la cui esecuzione è necessario il consenso del titolare dei diritti. Tali contestazioni prescindono dal fatto che l’output dei sistemi di Ai (ovvero il “risultato” generato in risposta alle richieste dell’utente) sia identico e/o simile a lavori precedentemente esistenti di artisti o creativi, da cui il sistema di Ai ha attinto per la creazione di un nuovo risultato.
Non appare possibile, d’altra parte, far rientrare l’attività dei sistemi di Ai nell’eccezione dell’articolo 68-bis della legge sul diritto d’autore, introdotto dal Dlgs 68/2003 (che ha attuato la Direttiva 2001/29/Ce). Tale previsione, che recepisce l’articolo 5, paragrafo 1 della Direttiva recita: «Sono esentati dal diritto di riproduzione gli atti di riproduzione temporanea privi di rilievo economico proprio che sono transitori o accessori e parte integrante ed essenziale di un procedimento tecnologico, eseguiti all’unico scopo di consentire la trasmissione in rete tra terzi con l’intervento di un intermediario, o un utilizzo legittimo di un’opera o di altri materiali».
Secondo l’interpretazione fornita dalla Corte di giustizia europea nella decisione del 16 luglio 2009 all’esito del procedimento C-5/08 (sentenza Infopaq), l’articolo 5 della direttiva è infatti di stretta interpretazione e impone, per la sua applicazione, che tutti i requisiti indicati siano cumulativamente integrati.
Inoltre, secondo parte della dottrina italiana la ratio alla base dell’introduzione di questa deroga al diritto di riproduzione sarebbe riconducibile al fatto che gli atti oggetto di eccezione sono privi di un valore economico autonomo e, quindi, non costituiscono una utilizzazione in concorrenza con il diritto esclusivo dell’autore. Cosa che nel caso dell’attività dei sistemi di Ai non appare accadere.
La strada della tutela è comunque difficile sia perché la velocità con cui i sistemi di Ai reperiscono le informazioni da elaborare per “allenarsi” non è conciliabile con i tempi necessari per negoziare one-to-one le licenze per lo sfruttamento dei contenuti protetti acquisiti in maniera automatizzata, sia per la difficoltà, per i singoli autori/creativi di agire nei confronti dei colossi tecnologici. È per questa ragione che molti artisti, in tutto il mondo, stanno dichiarando di voler rimuovere da internet le proprie opere per evitare che queste vengano utilizzate, senza il loro consenso, per “allenare” i sistemi di Ai.
I rapidi sviluppi tecnologici continuano a trasformare il modo in cui le opere del diritto d’autore vengono create, prodotte, distribuite e sfruttate: è quindi auspicabile che la normativa, da un lato, non limiti o rallenti la (inevitabile) evoluzione tecnologica e, dall’altro, preveda comunque forme di tutela per i diritti degli autori dei contenuti oggetto di acquisizione da parte dell’Ai.
- Argomenti
- diritto
- John Grisham
loading...