Non solo New York Times. La prestigiosa testata americana è stata la prima a portare in tribunale la software house OpenAI e, di conseguenza il suo finanziatore Microsoft, a causa dell’intelligenza artificiale (IA). Il Nyt li accusa infatti di violazione del copyright per l’uso non autorizzato di milioni di articoli per addestrare chatbot come ChatGpt e Copilot.
Adesso la stessa accusa è stata mossa anche da altri otto giornali made in Usa.
E se Cnn, Fox e Time sono ancora in trattativa con la società di Sam Altman sulla licenza dei loro contenuti, per l’Italia – secondo quanto contenuto nella relazione sull’IA coordinata da padre Paolo Benanti – non è una soluzione da disdegnare.
QUALI GIORNALI HANNO FATTO CAUSA A OPENAI E MICROSOFT
Mentre il colosso dell’editoria tedesco Axel Springer (proprietario di Politico, Business Insider, Welt e Bilt), il Financial Times, l’Associated Press, Le Monde e Prisa Media (con le sue pubblicazioni El País, Cinco Días, As ed El Huffpost), hanno stretto accordi con OpenAI per dare in pasto i loro articoli all’IA, otto testate dell’hedge fund Alden Global Capital si sono unite per dichiarargli guerra.
New York Daily News, Chicago Tribune, Orlando Sentinel, South Florida Sun Sentinel, The Mercury News, The Denver Post, The Orange County Register e The Pioneer Press hanno citato in giudizio OpenAI e Microsoft per violazione del copyright, nella corte del distretto meridionale di New York, la stessa utilizzata dal New York Times nella sua azione legale.
Lo scorso febbraio anche i siti di notizie The Intercept, AlterNet e Raw Story hanno intentato una causa contro i due colossi.
L’ACCUSA
La coalizione sostiene che sia OpenAI che Microsoft si sono serviti di milioni di articoli protetti da copyright, senza compenso o autorizzazione, per addestrare i loro chatbot.
I querelanti, afferma The Verge, hanno presentato come prova diversi estratti di conversazioni con ChatGpt e Copilot, nei quali si vede che entrambi riproducevano lunghi estratti di articoli specifici a comando, indicando che i loro dataset di addestramento includevano i testi di tali articoli.
Sono state inoltre mostrate schermate di Copilot, che può effettuare ricerche sul web in tempo reale, riproducendo alla lettera interi articoli di notizie uno o due giorni dopo la loro pubblicazione, senza “un collegamento ipertestuale ben visibile” all’articolo originale.
I quotidiani sostengono inoltre che i chatbot spesso attribuiscono fatti falsi o allucinazioni alle pubblicazioni.
UNA BATTAGLIA CONTRO L’INNOVAZIONE?
La denuncia ha tuttavia voluto sottolineare che non si tratta di fare la guerra al progresso e all’innovazione bensì a qualcosa che è illegale, ovvero violare il diritto d’autore: “Questa causa – si legge nel documento – non è una battaglia tra nuova tecnologia e vecchia tecnologia. Non è una battaglia tra un’industria fiorente e un’industria in transizione. E sicuramente non è una battaglia per risolvere la falange di questioni sociali, politiche, morali ed economiche che l’intelligenza artificiale generativa solleva. Questa causa riguarda il fatto che Microsoft e OpenAI non hanno il diritto di utilizzare i contenuti dei giornali protetti da copyright per costruire le loro nuove imprese da un trilione di dollari senza pagare per quei contenuti”.
COSA DICONO LE BIG TECH…
Nel caso del Nyt, OpenAI ha cercato di respingere la causa affermando che il quotidiano ha manipolato ChatGpt per riprodurre fedelmente il suo lavoro e Microsoft ha sostenuto che i modelli di IA sono solo strumenti, che potrebbero teoricamente essere usati per violare il copyright, ma “sono in grado di essere usati in modo sostanzialmente lecito”.
Inoltre, le big tech insistono sul fatto che l’uso di articoli pubblici online per l’addestramento degli algoritmi si qualifica come fair use (uso corretto), un concetto della legge sul diritto d’autore che consente il riutilizzo di opere protette da copyright se modificate in modo sostanziale.
…E COSA NON DICONO
Secondo quanto scritto dal Washington Post, però, “Microsoft, Google, OpenAI, Meta e altre aziende di IA hanno raccolto miliardi di frasi dal web per alimentare gli algoritmi che oggi costituiscono la spina dorsale di molti dei loro prodotti, come ChatGpt di OpenAI o Gemini di Google. Le aziende non hanno voluto dire esattamente che cosa è finito nei loro strumenti, ma le versioni precedenti e pubbliche della stessa tecnologia hanno attinto a piene mani da articoli di notizie protetti da copyright, oltre che da altre fonti come e-book e articoli di Wikipedia”.
E anche per quanto riguarda i generatori IA di immagini e video – vedi Sora di OpenAI – la trasparenza riguardo ai dati usati per addestrarli lascia alquanto a desiderare.
Ma le aziende tecnologiche sono pronte a combattere e quest’anno OpenAI ha iniziato a reclutare un corpo di avvocati per contrastare il crescente numero di cause legali che sta affrontando. Tuttavia, potrebbero non avere di che preoccuparsi dato che, secondo esperti come l’avvocato Laura Turini, il giudizio finale potrebbe essergli favorevole perché dimostrare che quello che producono i chatbot è una copia e, dunque, viola il copyright, è un terreno complesso e scivoloso.