Skip to content

nvidia

Pure le Ai di Nvidia sono copione?

Si fanno corpose le accuse di un gruppo di autori che sostiene che Nvidia avrebbe cibato le proprie Ai con decine di migliaia di libri contenuti nel database illecito Anna's Archive, entrando in contatto con i gestori della libreria ombra

Pure il colosso dei chip Nvidia, che grazie all’esplosione dell’Intelligenza artificiale vede aumentare i propri ordinativi di wafer al silicio, rischia di finire alla sbarra accusata, secondo l’atto introduttivo disponibile online, di avere utilizzato materiale su cui non aveva diritti per addestrare le proprie Ai proprietarie.

UNA CAUSA AVVIATA DUE ANNI FA

Benché infatti solitamente si faccia riferimento alla Big Tech guidata e fondata da Jen-Hsun Huang per l’attività di produttore di chip, l’azienda statunitense sta parallelamente sviluppando modelli proprietari come NeMo, Retro-48B, InstructRetro e Megatron. E la loro istruzione potrebbe essere avvenuta in modo non del tutto lecito, almeno secondo una causa legale avviata del 2024.

Tutto ha avuto inizio due anni fa, con la decisione di Brian Keene, Abdi Nazemian e Stewart O’Nan di intentare causa al colosso dell’elettronica sostenendo che i loro lavori facessero parte di un data set di circa 196.640 libri che sarebbero stati dati in pasto a NeMo per addestrarlo a simulare il linguaggio scritto, prima di essere rimossi in ottobre “a causa di una presunta violazione del copyright”.

Ora, ricostruisce The Indu, il 16 gennaio è stata depositata una prima denuncia consolidata e modificata che fornisce dettagli sulle presunte interazioni tra Nvidia e il ben noto database Anna’s Archive (che raccoglie testi ed e-book, in modo legale e illegale, da tutto il web per renderli consultabili in un unico luogo).

NVIDIA HA DATO L’OK A PRELEVARE MATERIALE DA ANNA’S ARCHIVE?

Gli attori nel caso di presunta violazione del copyright di Nvidia hanno affermato (e a quanto pare sembra siano in grado di provarlo anche attraverso un carteggio interno, ma spetterà alla Corte verificare) che, dopo il 2023, il colosso statunitense avrebbe contattato Anna’s Archive per ottenere informazioni sull’acquisizione delle sue collezioni piratate e del suo set di dati per gli Llm.

Dopo una serie di scambi di e-mail con Anna’s Archive, Nvidia sarebbe stata pronta a procedere, hanno affermato gli autori della causa: “Entro una settimana dal contatto con Anna’s Archive, e pochi giorni dopo essere stati avvertiti dalla stessa della natura illegale delle loro collezioni, la dirigenza di Nvidia ha dato “luce verde” per procedere con la pirateria. Anna’s Archive ha offerto a NVIDIA milioni di libri piratati e protetti da copyright”, si legge nel documento.

Documento che poi allarga la visuale all’intero panorama di software house impegnate nello sviluppo di Ai: “Praticamente tutti i principali sviluppatori di Llm, inclusi OpenAI, Meta e Anthropic, hanno piratato libri da Library Genesis, Z-Library, Sci-Hub e/o Pirate Library Mirror. Nvidia – viene infatti sostenuto nell’atto appena depositato – ha seguito questa pratica diffusa nel settore e ha piratato intere raccolte di libri da biblioteche ombra”. Con gli autori che poi chiosano: “Documenti interni mostrano che le pressioni della concorrenza hanno spinto Nvidia alla pirateria”.

LA POSIZIONE DEL COLOSSO USA

Dal canto suo, la società con sede a Santa Clara similmente ad altre Big Tech che hanno dovuto difendersi da accuse simili asserisce che le azioni rientrino nel “fair use” dei titoli che non vengono usati come opere da leggere o distribuire, ma soltanto come insiemi di dati statistici (dunque pattern linguistici). Resta da capire se tale strategia difensiva, che non nega l’azione ma tenta solo di darle una differente interpretazione, reggerà in un’aula di tribunale. Ogni sentenza in merito farà giurisprudenza essendo per ovvi motivi ancora pochissime le pronunce in merito.

Torna su