Skip to content

Ilya Sutskever

Ilya Sutskever e le ere dell’intelligenza artificiale

Nato nell'allora Urss, Ilya Sutskever, classe 1986, è il ricercatore cruciale reclutato da Sam Altman ed Elon Musk nel 2015 con l’avvio di OpenAI, di cui è stato storico chief scientist fino all'anno scorso. Nel podcast di Dwarkesh Patel, Sutskever parla di tre ere dell’intelligenza artificiale che si sarebbero sviluppate in meno di 15 anni. L'approfondimento di Alessandro Aresu

Ilya Sutskever è un informatico nato nel 1986 nell’allora Unione Sovietica e cresciuto tra Israele e Canada. Studente all’Università di Toronto di Geoffrey Hinton, con lui e Alex Krizhevsky ha realizzato AlexNet, la svolta che ha innescato il cosiddetto “Big Bang” dell’intelligenza artificiale nel 2012 vincendo la competizione di riconoscimento di immagini dell’archivio ImageNet. Da quel momento, è divenuto un protagonista di primo piano della ricerca e dell’impresa nell’intelligenza artificiale, con contributi alle reti neurali ricorrenti e all’apprendimento sequence-to-sequence. Il suo lavoro accademico è stato citato centinaia di migliaia di volte. Soprattutto, Sutskever è il ricercatore cruciale reclutato da Sam Altman ed Elon Musk nel 2015 con l’avvio di OpenAI, di cui è stato storico chief scientist (nella foto è al centro, alla sua sinistra Sam Altman).

Protagonista del goffo tentativo di sostituire Sam Altman dalla guida dell’azienda, ha poi avviato nel 2024 il suo laboratorio, Safe Superintelligence Inc. (SSI), con l’unico obiettivo di creare un’intelligenza superintelligente sicura. Gli interventi e le parole di Sutskever (ora meno frequenti rispetto al passato) sono sempre stati importanti per comprendere lo stato dell’arte della ricerca applicata sull’intelligenza artificiale e la sua accelerazione. Si pensi per esempio al suo dialogo con Jensen Huang di maggio 2023 (in cui indossa una maglietta col motivo della “pecora nera” reso celebre da Jensen Huang). Per questo, la sua recente intervista nel seguitissimo podcast di Dwarkesh Patel merita una particolare considerazione, anche perché mostra l’evoluzione del suo pensiero. 

La prima fase del pensiero di Sutskever è fortemente legata all’intuizione dello scaling. Già nel 2014, nei suoi lavori stabiliva l’ipotesi che addestrare una rete neurale molto grande su un dataset molto grande garantisse un maggiore successo. Questo principio (in sintesi: più dati e più capacità di calcolo) è stato un motore significativo del progresso recente dell’intelligenza artificiale, in cui la quantità sembra avere un’importanza essenziale. 

Sutskever ha sottolineato che, in quel contesto, la domanda su quali dati utilizzare non aveva una risposta complessa. La risposta era: “tutto”. Tuttavia, il suo pensiero è evoluto riconoscendo la fragilità di questo paradigma. Negli ultimi due anni ha paragonato i dati al combustibile fossile dell’intelligenza artificiale, perché esiste solo un Internet e, sebbene i computer continuino a crescere in potenza, la quantità di dati non cresce. Il raggiungimento del picco di dati funziona come una barriera che porta ad esplorare nuove strade: il pre-addestramento potenziato, l’apprendimento rafforzato, l’uso crescente di dati sintetici e altre tecniche. Ma nessuna di queste soluzioni è veramente “nuova”. Nel mentre, la tesi principale (“più dati ma soprattutto più capacità di calcolo”) continua a essere perseguita dalle aziende (e continua ad arricchire NVIDIA). La tesi diviene “sempre più soldi investiti in data center” e di conseguenza, a fronte delle valutazioni delle aziende e degli investimenti circolari, sempre più preoccupazioni sulla bolla. 

Nel dialogo con Dwarkesh Patel, Sutskever cerca di mettere ordine proponendo una cronologia dell’equilibrio tra ricerca e scaling, e cioè tra ricerca e investimento, parlando di tre ere dell’intelligenza artificiale che si sarebbero sviluppate in meno di 15 anni.  

All’inizio c’era l’Era della Ricerca (2012–2020): inizialmente, il machine learning, che non viveva di una dimensione commerciale, si basava sulle intuizioni dei ricercatori, che formavano una piccola comunità. L’Era della Ricerca è stata caratterizzata dalla necessità di trovare nuove idee e algoritmi. AlexNet e lo stesso Transformer (introdotto dai ricercatori di Google nel 2017) non richiedevano la massima quantità di calcolo disponibile all’epoca, ma idee brillanti.

Poi è venuta l’Era dello Scaling (2020–2025): l’intuizione dello scaling come rotta di crescita quantitativa ha dato una direzione precisa alla comunità, fornendo una ricetta a basso rischio per investire risorse (più dati, più calcolo, reti neurali più grandi) e per rendere disponibili i prodotti che, a partire da ChatGPT, hanno garantito l’attenzione commerciale e la concentrazione delle risorse dell’ecosistema statunitense verso l’intelligenza artificiale. Questa mentalità, per usare le parole di Sutskever, ha “risucchiato tutta l’aria nella stanza”, portando tutte le aziende a fare la stessa cosa.

Infine, Sutskever propone il ritorno all’Era della Ricerca (dal 2025 in poi): a suo avviso, lo scaling ha raggiunto un punto in cui non è più il differenziatore principale. Oggi non è scontato che un aumento di 100 volte della scala trasformerebbe radicalmente il settore. Di conseguenza, siamo di nuovo in un’era della ricerca, anche se abbiamo “computer più grandi”. Come Demis Hassabis di Google DeepMind, Sutskever è uno dei protagonisti ormai di lungo corso della disciplina e delle aziende di questo secolo che non ritiene che arriveremo a una forma di “superintelligenza” senza profonde svolte nell’ambito della ricerca. 

Per ora, il pensiero di Sutskever si è concretizzato in SSI, una società che ha perso il suo co-fondatore Daniel Gross, attirato negli scorsi mesi dalle offerte economiche di Mark Zuckerberg per Meta. Secondo Sutskever, mentre altre aziende di frontiera guardano al successo economico come parametro, SSI si distingue perché punta direttamente a una “superintelligenza sicura”, isolandosi dalla competizione quotidiana del mercato.

Nel dialogo con Patel, Sutskever prevede anche che, man mano che l’intelligenza artificiale diventerà più potente in modo tangibile (superando quindi attraverso alcune svolte in materia di ricerca le limitazioni che lui stesso nota), tutte le aziende coinvolte diventeranno molto più “paranoiche” sulla sicurezza. Per Sutskever, l’obiettivo finale può essere la convergenza strategica tra le aziende, per la costruzione di un’intelligenza artificiale che si preoccupi specificamente della vita senziente. Un progetto a cui, secondo lui, parteciperanno direttamente anche i governi. 

Ovviamente, la tesi delle “ere dell’intelligenza artificiale” di Sutskever è anche pro domo sua, perché vuole confermare che l’approccio di SSI sia giusto e potenzialmente perseguibile, a fronte di concorrenti più potenti. Diverso è il caso di Demis Hassabis: essendo parte del sistema di Google, può infatti continuare a vivere sia nell’Era dello Scaling (grazie alle enormi risorse di cui dispone, all’infrastruttura, alla piattaforma, alla distribuzione, all’integrazione) sia lavorare per il ritorno all’Era della Ricerca. 

Torna su