Sono in arrivo modelli di intelligenza artificiale (IA) capaci di ragionare e pianificare. È l’annuncio di OpenAI e Meta, che nel 2024 si apprestano a rilasciare grandi novità, secondo quanto dichiarato dai loro dirigenti al Financial Times.
I SUPER MODELLI DI OPENAI E META
OpenAI, che conta sul sostegno di Microsoft, non ha fornito una data precisa per il lancio del suo nuovo modello linguistico di grandi dimensioni (LLM), ma dovrebbe chiamarsi Gpt-5 e arrivare “presto”.
Brad Lightcap, chief operating officer di OpenAI, ha inoltre detto al FT che “la prossima generazione di Gpt mostrerà progressi nella risoluzione di ‘problemi difficili’ come il ragionamento”. I sistemi di IA di oggi sono “davvero bravi a svolgere piccoli compiti una tantum”, ha aggiunto, ma le loro capacità sono ancora “piuttosto limitate”.
Meta, invece, ha fatto sapere che inizierà a distribuire la sua versione Llama 3 in una serie di modelli di varie dimensioni già nelle prossime settimane, per applicazioni e dispositivi diversi e che intende incorporarle in WhatsApp e negli smart glasses Ray-Ban. “Stiamo lavorando sodo per capire come far sì che questi modelli non si limitino a parlare, ma ragionino, pianifichino… abbiano una memoria”, ha dichiarato Joelle Pineau, vicepresidente della ricerca sull’intelligenza artificiale dell’azienda.
Anche il capo scienziato di Meta, Yann LeCun, ha precisato che gli attuali sistemi di IA “producono una parola dopo l’altra senza pensare e pianificare” perché faticano a gestire domande complesse o a conservare le informazioni per un lungo periodo, oltre a commettere ancora “errori stupidi”.
LA RIVOLUZIONE DEL RAGIONAMENTO NELLA PRATICA
Come hanno osservato gli esperti, il ragionamento e la pianificazione permetterebbero ai chatbot di completare sequenze di compiti correlati e di prevedere le conseguenze delle loro azioni.
Si tratta di un “grande tassello mancante su cui stiamo lavorando per portare le macchine al livello successivo di intelligenza”, ha aggiunto LeCun, spiegando che per esempio stanno lavorando su “agenti” di IA in grado di pianificare e prenotare ogni fase di un viaggio.
Chris Cox, chief product officer di Meta, invece, ha portato come esempio quello degli smart glasses Ray-Ban che, quando indossati, sarebbero capaci, grazie alle fotocamere, di dare indicazioni su come riparare una macchina del caffè rotta.
Inoltre, secondo quanto riferito a fine febbraio da The Information citato da Reuters, Meta prevede di nominare una persona interna per supervisionare l’addestramento del tono e della sicurezza del suo chatbot, come parte della volontà di rendere le risposte del modello più sfumate.
L’OPACO MERCATO DEI DATI PER ADDESTRARE L’IA
Ma per affinare i modelli di IA è necessaria un’infinità di dati, gli stessi che OpenAI ha dichiarato di non essere sicura di sapere da dove li prende per addestrare il suo generatore di immagini IA Sora.
Quello dei dati per l’intelligenza artificiale, stando a molte delle principali società di ricerca di mercato è un campo così opaco che non hanno nemmeno iniziato a stimare le dimensioni. Anche perché le aziende (vedi OpenAI) spesso non rivelano gli accordi. I ricercatori di Business Research Insights, tuttavia, ritengono che oggi il valore del mercato si aggiri intorno ai 2,5 miliardi di dollari e prevedono che possa crescere fino a 30 miliardi di dollari entro un decennio.
ACCORDI PIÙ O MENO NOTI
Nei mesi successivi al debutto di ChatGpt alla fine del 2022, le big tech hanno stretto accordi con Shutterstock per utilizzare centinaia di milioni di immagini, video e file musicali della sua libreria per addestrare le proprie IA. Gli accordi, secondo le fonti di Reuters, erano inizialmente compresi tra i 25 e i 50 milioni di dollari ciascuno, anche se la maggior parte è stata successivamente ampliata.
Freepik, un concorrente di Shutterstock, ha dichiarato all’agenzia di stampa di aver concluso accordi con due grandi aziende tecnologiche per la concessione in licenza della maggior parte del suo archivio di 200 milioni di immagini a 2-4 centesimi per immagine e di avere in cantiere altri cinque accordi simili.
“Le tariffe variano a seconda dell’acquirente e del tipo di contenuto”, ha detto Daniela Braga, amministratore delegato di Defined.ai, azienda con sede a Seattle che concede in licenza i dati a una serie di aziende tra cui Google, Meta, Apple, Amazon e Microsoft. Ma ha anche aggiunto che generalmente le società “sono disposte a pagare da 1 a 2 dollari per immagine, da 2 a 4 dollari per video di breve durata e da 100 a 300 dollari per un’ora di filmati più lunghi”. La tariffa di mercato per il testo è di 0,001 dollari per parola, mentre quella per le immagini di nudo va dai 5 ai 7 dollari.
OpenAI, uno dei primi clienti di Shutterstock, ha anche firmato accordi di licenza con almeno quattro organizzazioni giornalistiche, tra cui The Associated Press e Axel Springer. Reuters News, invece, ha dichiarato di aver concluso accordi per la concessione in licenza di contenuti giornalistici per l’addestramento di modelli linguistici ma non ha rivelato i dettagli.