Vuoi ricevere i nostri aggiornamenti?

Registrati per accedere ai contenuti riservati e iscriverti alla nostra newsletter

Tutela della proprietà intellettuale e sviluppo dei sistemi di AI: due posizioni inconciliabili?

23/09/2024

 AI e IP Law

Sono due gli aspetti critici legati alla tutela della proprietà intellettuale sollevati dallo sviluppo e dall’uso dei sistemi di Intelligenza Artificiale.

Una prima questione è relativa all’uso indiscriminato di informazioni anche coperte da diritti di proprietà intellettuale nell’addestramento dei sistemi di AI e riguarda fondamentalmente i fornitori.

Per la definzione di fornitore si rimanda all'Art. 3 AI ACT: una persona fisica o giuridica, un'autorità pubblica, un'agenzia o un altro organismo che sviluppa un sistema di IA o un modello di IA per finalità generali o che fa sviluppare un sistema di IA o un modello di IA per finalità generali e immette tale sistema o modello sul mercato o mette in servizio il sistema di IA con il proprio nome o marchio, a titolo oneroso o gratuito.

Il secondo tema concerne invece il riconoscimento o meno della tutela delle opere generate dai sistemi di AI e coinvolge i deployer.

Art. 3 AI ACT: “deployer”: una persona fisica o giuridica, un’autorità pubblica, un’agenzia o un altro organismo che utilizza un sistema di IA sotto la propria autorità, tranne nel caso in cui il sistema di IA sia utilizzato nel corso di un'attività personale non professionale.

In questo contributo ci occuperemo del primo aspetto, riservando la trattazione del secondo profilo ad un prossimo approfondimento.

La tutela della proprietà intellettuale dei dati di addestramento

Per l’addestramento di algoritmi di intelligenza artificiale generativa, in particolare per i sistemi a finalità generali, gli sviluppatori ricorrono molto spesso ad attività di web scraping.

Informazioni e dati possono essere raccolti in maniera sistematica attraverso programmi (web robot) che operano in maniera automatizzata simulando la navigazione umana, a condizione che le risorse visitate da questi ultimi risultino accessibili al pubblico indistinto e non sottoposte a controlli di accesso. Uno studio (Imperva – Bad bot report) ha rivelato che, nell’anno 2023, il 49,6% di tutto il traffico Internet è stato generato dai bot con un aumento pari al 2,1% rispetto all’anno precedente, aumento che è stato parzialmente ricondotto alla diffusione di sistemi di intelligenza artificiale e, in particolare, dei modelli linguistici di grandi dimensioni (di seguito anche “LLM” - Large Language Model) sottesi all’intelligenza artificiale generativa (Provvedimento Garante per la tutela dei dati personali 20 maggio 2024 – nota informativa sullo web scraping).

In questa indiscriminata attività di raccolta di dati finiscono nella “rete”, oltre ai dati personali, anche molte informazioni originariamente tutelate da diritti di proprietà intellettuale.

Da una parte abbiamo, quindi, i fornitori dei sistemi di intelligenza artificiale che hanno un interesse ad accedere in modo illimitato e senza costi a quell’enorme massa di dati presenti nel web; dall’altra parte i titolari dei diritti di proprietà intellettuale vorrebbero veder tutelati i loro diritti.

Il legislatore deve trovare una strada per contemperare le due esigenze, avendo ben presente che una normativa che, in questo momento storico, ostacoli o renda troppo oneroso lo sviluppo dell’intelligenza artificiale potrebbe tradursi in un ostacolo allo sviluppo competitivo.

L’Unione europea si è mossa su più fronti, mettendo in campo da anni una propria strategia di digitalizzazione EU Digital Strategy - EU4Digital (eufordigital.eu) e sono numerosi gli interventi normativi che riguardano i dati (personali e non). Le fonti di dati di qualità utilizzabili sono in realtà numerose (per un approfondimento si rimanda al nostro articolo "Dati di qualità per lo sviluppo dell’intelligenza artificiale")

Il recente Regolamento UE 1689/2024 (AI ACT) prevede all’art. 53 comma 1 che

I fornitori di modelli di AI per finalità generali:
c) attuano una politica volta ad adempiere al diritto dell'Unione in materia di diritto d'autore e diritti ad esso collegati e, in particolare, a individuare e rispettare, anche attraverso tecnologie all'avanguardia, una riserva di diritti espressa a norma dell'articolo 4, paragrafo 3, della direttiva (UE) 2019/790;
d) redigono e mettono a disposizione del pubblico una sintesi sufficientemente dettagliata dei contenuti utilizzati per l'addestramento del modello di IA per finalità generali, secondo un modello fornito dall'ufficio per l'IA”.

L’AI ACT non si pone come scopo principale quello di disciplinare gli aspetti legati alla tutela del diritto d’autore, che infatti tratta solo marginalmente; nel quadro legislativo europeo però la Direttiva 2019/970 (Digital single market) all’art. 4 permette il text and data mining da opere o materiali a cui si abbia legalmente accesso almeno che l’autore non abbia espresso una riserva contro tali usi (c.d. op out).

La DSM viene esplicitamente richiamata dall’art. 53 dell’AI ACT.

L’art. 53 AI ACT impone, dunque, ai fornitori due adempimenti specifici in relazione al tema della tutela dei diritti IP.

  1. L’adozione di politiche aziendali, codici di condotta che prevedano la tutela della proprietà intellettuale e, in particolare, garantiscano l’individuazione e il rispetto delle riserve espresse dai titolari dei diritti in modo appropriato, ad esempio attraverso strumenti che consentano lettura automatizzata in caso di contenuti resi pubblicamente disponibili online (art. 3 comma 4 Dir. UE 2019/790).
  2. La redazione e pubblicazione di un documento di sintesi dei contenuti utilizzati per l’addestramento degli algoritmi. L’art. 53 prevede che un modello di documento sia reso disponibile dall’ufficio per l’IA e stabilisce che la sintesi debba essere sufficientemente dettagliata; al momento non è possibile dire quale sarà il livello di dettaglio richiesto, è prevedibile che non saranno accettati documenti totalmente generici tali da violare sostanzialmente l’obbligo di trasparenza previsto dal Regolamento.
    Probabilmente il modello che l’ufficio per l’IA dovrà predisporre fornirà un’utile guida non solo per la redazione del documento di sintesi ma anche per la predisposizione delle policy interne.

L’art. 53 AI ACT richiede, d’altro canto, anche ai titolari dei diritti di IP un adempimento ovvero quello di segnalare in maniera appropriata se un contenuto è liberamente disponibile o meno (opt out).

Per quanto riguarda il Disegno di Legge sull’intelligenza artificiale italiano, l’attuale testo prevede all’art. 24 l’inserimento nella Legge 633/1941 dell’art. 70 septies:

«La riproduzione e l’estrazione di opere o altri materiali attraverso modelli e sistemi di intelligenza artificiale anche generativa, sono consentite in conformità con gli articoli 70-ter e 70-quater.»

ovvero

  • da parte di istituti di ricerca o di istituti a tutela del patrimonio culturale per scopi di ricerca scientifica
  • quando la riproduzione o estrazione non è stata espressamente riservata da parte dei titolari del diritto d’autore.

La strategia europea sui dati mette quindi a disposizione svariate fonti di dati per i fornitori di sistemi di AI e non è impedita neppure la possibilità di utilizzare i dati presenti nel web, nel rispetto delle prescrizioni (poche) dell’AI ACT.

Rubrica "AI LEGAL, un prisma da comporre"

Leggi gli altri articoli presenti nella nostra rubrica dedicata.