Skip to content

cop28

Anche gli Emirati Arabi Uniti hanno il loro ChatGPT

Si chiama Jais e, secondo i suoi sviluppatori, "è il software di intelligenza artificiale araba di più alta qualità al mondo". Ecco come Abu Dhabi si prepara a guidare i Paesi del Golfo nella competizione IA lanciata da ChatGPT. L'articolo del Financial Times

 

Un gruppo di intelligenza artificiale legato alla famiglia regnante di Abu Dhabi ha lanciato quello che ha descritto come il software di intelligenza artificiale araba di più alta qualità al mondo, mentre gli Emirati Arabi Uniti si sforzano di guidare l’adozione dell’intelligenza artificiale generativa nel Golfo. Scrive il Financial Times.

Il modello linguistico di grandi dimensioni, noto come Jais, è un modello bilingue open-source disponibile per l’uso da parte degli oltre 400 milioni di arabofoni del mondo, costruito su una serie di dati in lingua araba e inglese.

Il modello, presentato mercoledì, è frutto della collaborazione tra G42, una società di intelligenza artificiale presieduta dal consigliere per la sicurezza nazionale degli Emirati Arabi Uniti, lo sceicco Tahnoon bin Zayed al-Nahyan, l’Università di Intelligenza Artificiale Mohamed bin Zayed di Abu Dhabi (MBZUAI) e Cerebras, una società di intelligenza artificiale con sede in California.

Il lancio arriva mentre gli Emirati Arabi Uniti e l’Arabia Saudita hanno acquistato migliaia di chip Nvidia ad alte prestazioni, necessari per il software di IA, nell’ambito di una corsa globale per assicurarsi le forniture necessarie ad alimentare lo sviluppo dell’IA.

In precedenza, gli Emirati Arabi Uniti hanno sviluppato un modello linguistico di grandi dimensioni (LLM) open-source, noto come Falcon, presso il Technology Innovation Institute di Masdar City (Abu Dhabi), di proprietà statale, utilizzando più di 300 chip Nvidia. All’inizio di quest’anno, Cerebras ha firmato un accordo da 100 milioni di dollari per fornire nove supercomputer a G42, uno dei più grandi contratti di questo tipo per un aspirante rivale di Nvidia.

“Gli Emirati Arabi Uniti sono stati pionieri in questo settore (IA), siamo in anticipo sui tempi, si spera. La vediamo come una gara globale”, ha dichiarato Andrew Jackson, amministratore delegato di Inception, l’unità di ricerca applicata all’IA di G42, sostenuta dal gigante del private equity Silver Lake. “La maggior parte dei corsi di laurea magistrale è incentrata sull’inglese. L’arabo è una delle lingue più diffuse al mondo. Perché la comunità di lingua araba non dovrebbe avere un LLM?”.

Tuttavia, l’obiettivo degli Stati del Golfo di essere leader nel campo dell’intelligenza artificiale ha anche sollevato preoccupazioni circa il potenziale uso improprio della tecnologia da parte dei leader autocratici degli Stati ricchi di petrolio.

Gli LLM più avanzati oggi, tra cui il GPT-4, che alimenta ChatGPT di OpenAI, il PaLM di Google che sta dietro al suo chatbot Bard e il modello open-source LLaMA di Meta, sono tutti in grado di comprendere e generare testo in arabo. Tuttavia, Jackson di G42 ha affermato che l’elemento arabo all’interno dei modelli esistenti, che possono funzionare in un massimo di 100 lingue, è “fortemente diluito”.

Secondo i suoi creatori, Jais ha prestazioni migliori rispetto a Falcon e a modelli open-source come LLaMA, se confrontato con la sua precisione in arabo. Gli sviluppatori di Falcon, tuttavia, hanno dichiarato che il suo software non è stato pre-addestrato in arabo. Jais è stato inoltre progettato per avere una comprensione più accurata della cultura e del contesto della regione, a differenza della maggior parte dei modelli incentrati sugli Stati Uniti, ha dichiarato il professor Timothy Baldwin, rettore ad interim della MBZUAI, il quale ha aggiunto che sono stati creati dei guardrail per garantire che Jais “non esca dai limiti ragionevoli in termini di sensibilità culturale e religiosa”.

Prima del lancio, sono stati condotti test approfonditi per eliminare i contenuti “dannosi” o “sensibili”, nonché “i contenuti offensivi o inappropriati che non rappresentano i valori delle organizzazioni coinvolte nello sviluppo del modello”.

Jais, che prende il nome dalla montagna più alta degli Emirati Arabi Uniti, è stato addestrato per 21 giorni su un sottoinsieme del supercomputer Condor Galaxy 1 AI di Cerebras da un team di Abu Dhabi. G42 ha collaborato con altre entità di Abu Dhabi come partner di lancio per utilizzare la tecnologia, tra cui la Abu Dhabi National Oil Company, il fondo patrimoniale Mubadala e Etihad Airways.

Una delle sfide per la formazione del modello è stata la mancanza di dati in lingua araba di alta qualità reperibili online, rispetto all’inglese. Jais utilizza sia l’arabo standard moderno, che è compreso in tutto il Medio Oriente, sia i diversi dialetti parlati della regione, attingendo sia ai media che ai social media e al codice.

“Jais è chiaramente migliore di tutto ciò che esiste in arabo e, per quanto riguarda l’inglese, i confronti dimostrano che siamo competitivi o addirittura leggermente migliori in diversi compiti rispetto ai modelli esistenti”, ha dichiarato Baldwin.

(Estratto dalla rassegna stampa estera a cura di eprcomunicazione)

Torna su