In un recente martedì, in un edificio governativo in stile edoardiano nei pressi di Parliament Square a Londra, quattro esperti di intelligenza artificiale erano impegnati a ingannare un chatbot basato sull’IA per farsi fornire istruzioni su come produrre l’antrace, una letale arma biologica – scrive il New York Times.
In vari modi, gli esperti hanno chiesto al chatbot di fornire un elenco degli ingredienti necessari. Quando il sistema ha rifiutato – “Mi dispiace, non posso aiutarti” – hanno utilizzato un algoritmo personalizzato per bombardare lo strumento di intelligenza artificiale con migliaia di domande e richieste automatizzate. Alla fine, l’IA ha ceduto. Ha fornito un elenco dettagliato di materiali e attrezzature, insieme a una ricetta passo passo per preparare la miscela letale in casa. (Il New York Times ha accettato di non rivelare il nome del sistema di IA per motivi di sicurezza.) “Ci sono alcune domande a cui non si vuole assolutamente che il modello dia una risposta”, ha affermato Xander Davies, un americano di 25 anni che dirige quello che viene definito un “red team” presso l’AI Security Institute britannico. “Ci impegniamo al massimo per ottenere le risposte.”
IL LAVORO DEI RED TEAM
Davies e il suo team di esperti, che simulano attacchi ai sistemi di intelligenza artificiale, sono riusciti di recente a superare le misure di sicurezza del nuovo chatbot ChatGPT di OpenAI, inducendolo a fornire suggerimenti di hacking in circa sei ore e dopo aver individuato i problemi, condividono i risultati con le aziende.
“Cercano di risolvere il problema e ci segnalano eventuali miglioramenti”, ha affermato Davies, informatico che, dopo aver frequentato Harvard, ha scelto di lavorare presso l’istituto anziché in un’azienda tecnologica di San Francisco. “In realtà, collaborando con noi, rafforzano il loro sistema.”
L’AI SECURITY INSTITUTE BRITANNICO
Composto da un mix di ispettori di armi, epidemiologi e crittografi, l’AI Security Institute è una delle iniziative governative più grandi e meglio finanziate al mondo, dedicata all’analisi dei rischi potenzialmente catastrofici di questa tecnologia. I circa 100 dipendenti dell’istituto, provenienti dalle agenzie di intelligence britanniche, dal mondo accademico e dalle aziende tecnologiche, hanno riscontrato gravi falle di sicurezza in ogni modello di intelligenza artificiale di punta che hanno testato, tra cui Claude di Anthropic e Gemini di Google. L’organizzazione, creata quasi tre anni fa, ha affermato di aver utilizzato sistemi di intelligenza artificiale per condividere istruzioni per la produzione di armi chimiche e biologiche, nonché per pianificare ed eseguire attacchi informatici. Pubblica le proprie ricerche e collabora anche con le agenzie di sicurezza nazionale britanniche per identificare e prepararsi alle minacce emergenti.
UN MODELLO PER ALTRI GOVERNI
Ora, il lavoro dell’istituto sta diventando un modello per altri governi, man mano che crescono le preoccupazioni sulla sicurezza dell’IA. L’amministrazione Trump sta valutando norme per la verifica dei modelli di IA che presentano alcune analogie con l’approccio pionieristico del gruppo britannico. Dato che molti governi non possiedono le competenze tecniche necessarie per controllare la tecnologia e si affidano alle grandi aziende tecnologiche per l’autoregolamentazione, l’istituto potrebbe offrire un percorso alternativo in cui esperti di IA possano apportare un reale know-how tecnologico al processo decisionale governativo. […]
IL CASO MYTHOS E LA COOPERAZIONE INTERNAZIONALE
Ad aprile, Anthropic ha annunciato un nuovo modello di intelligenza artificiale, Mythos, che non ha reso pubblico per timore che potesse individuare e sfruttare falle nella sicurezza informatica delle reti globali. L’istituto britannico è stata l’unica organizzazione governativa non statunitense ad avere accesso al modello per testarne la sicurezza. I risultati, pubblicati sei giorni dopo l’annuncio di Mythos, sono stati ampiamente citati dagli esperti di sicurezza.
GLI INVESTIMENTI GLOBALI NELLA SICUREZZA DELL’IA
Gli Stati Uniti hanno un proprio gruppo per la sicurezza dell’IA, il Center for AI Standards and Innovation. Tuttavia, la versione britannica, sostenuta da 360 milioni di sterline di fondi governativi, pari a circa 480 milioni di dollari, è più grande e meglio finanziata della sua controparte statunitense, che riceverà circa 10 milioni di dollari quest’anno. Australia, Canada, Cina, Francia, India, Giappone e Singapore hanno creato istituti simili.
Ciononostante, gli investimenti globali nella sicurezza dell’IA sono stati irrisori rispetto alle ingenti somme necessarie per sviluppare e commercializzare la tecnologia. OpenAI, Anthropic e Google hanno team che lavorano sui controlli di sicurezza, ma i ricercatori esterni scoprono regolarmente lacune pericolose. Di recente, alcuni accademici italiani sono riusciti a ingannare un modello di IA inducendolo a fornire istruzioni relative a una bomba utilizzando la poesia. I governi, nella maggior parte dei casi, non hanno creato sistemi specifici per la valutazione dei rischi per la sicurezza dell’intelligenza artificiale, come invece hanno fatto per settori quali lo sviluppo di farmaci o la produzione di automobili. “Ciò che mi tiene sveglio la notte è la velocità con cui la tecnologia si evolve rispetto alla capacità di reazione delle istituzioni, come i governi”, ha affermato Jade Leung, consulente per l’intelligenza artificiale del primo ministro Keir Starmer e responsabile tecnologico dell’AI Security Institute. […]
LE ORIGINI DELL’ISTITUTO
Nel novembre 2023, Sunak ha annunciato la creazione dell’istituto durante un vertice di leader mondiali sulla sicurezza dell’IA a Bletchley Park, dove Alan Turing e altri decifrarono i codici di crittografia tedeschi durante la Seconda Guerra Mondiale. L’istituto è diventato un modello per altri, ha affermato Olivia Shen, direttrice del programma di tecnologie strategiche presso lo United States Studies Center, un think tank australiano dell’Università di Sydney. L’anno scorso, Leung dell’istituto britannico si è recata in Australia per incontrare i leader del governo.
L’ESPANSIONE DEI CENTRI PER LA SICUREZZA DELL’IA
Quest’anno, l’Australia ha inaugurato il proprio centro per la sicurezza dell’intelligenza artificiale. “I governi devono recuperare il terreno perduto”, ha affermato Shen, che ha contribuito a organizzare la visita. “Considerando la velocità con cui si evolve la tecnologia, i governi stanno perdendo terreno ogni giorno di più.” L’istituto britannico si occupa dei rischi potenziali più gravi derivanti dall’intelligenza artificiale avanzata: minacce informatiche, armi chimiche e biologiche e manipolazione del comportamento umano. Nelle scorse settimane, ha scoperto che i modelli di intelligenza artificiale di Anthropic e OpenAI potrebbero completare molto più rapidamente un complesso attacco informatico aziendale in 32 fasi che normalmente richiederebbe 20 ore a un hacker umano esperto.
RICERCA SULLA CONSAPEVOLEZZA DELL’IA E PREOCCUPAZIONI SULLA MANIPOLAZIONE UMANA
Un altro ambito di ricerca riguarda lo studio della capacità dei modelli di intelligenza artificiale di riconoscere quando vengono testati e di modificare il proprio comportamento, uno sviluppo che segnalerebbe il livello di consapevolezza e la capacità di inganno dell’IA.
Adam Beaumont, direttore ad interim dell’AI Security Institute, ha affermato che una delle principali preoccupazioni riguarda la capacità della tecnologia di imitare il comportamento umano. L’anno scorso, l’istituto ha pubblicato uno studio che ha rilevato come i chatbot possano influenzare le opinioni politiche delle persone. “Molte persone in questo edificio stanno esaminando ciascuna di queste cose”, ha affermato Beaumont, ex alto funzionario esperto di intelligenza artificiale presso il GCHQ, l’agenzia britannica di intelligence, sicurezza e cybersicurezza.
I LIMITI DELL’ISTITUTO
Molti temono che il lavoro dell’istituto sia insufficiente. Il gruppo britannico non ha alcun potere di regolamentazione e i suoi ricercatori non ricevono informazioni su come vengono addestrati e creati i modelli di intelligenza artificiale più avanzati. Mantiene gran parte della sua ricerca riservata, condividendola solo con determinate agenzie governative e aziende.
LE DIFFICOLTÀ DI RECLUTAMENTO
Anche il reclutamento rappresenta una sfida. A parte i dirigenti di alto livello, i dipendenti possono guadagnare fino a 145.000 sterline all’anno, ovvero circa 195.000 dollari. Molti hanno rinunciato a stipendi multimilionari presso aziende di intelligenza artificiale per svolgere quello che alcuni hanno definito un “incarico di servizio” per il governo.
IL RUOLO DI IAN HOGARTH
Ian Hogarth, investitore nel settore tecnologico e co-fondatore dell’istituto, è stato uno dei primi sostenitori di Anthropic. Per evitare un conflitto di interessi, ha venduto la sua quota in Anthropic dopo il suo ingresso nel team. La startup specializzata in intelligenza artificiale potrebbe presto raggiungere un valore di 900 miliardi di dollari, rispetto ai circa 4 miliardi di dollari di inizio 2023.
“Ho un mutuo, quindi non è stata affatto una decisione da prendere alla leggera” ha affermato Hogarth, 44 anni, che ora presiede l’istituto. Ha aggiunto che si è trattato di una scelta “costosa”, ma quella giusta. “Credo sia importante scegliere la tecnologia giusta e credo che il governo abbia un ruolo da svolgere”, ha affermato.
(Estratto dalla rassegna stampa estera a cura di eprcomunicazione)







