Il modello di intelligenza artificiale (IA) di Google è qui. Si chiama Gemini ed è arrivato quasi a sorpresa nella competizione con gli altri big. Per Sissie Hsiao, vicepresidente del chatbot IA di Google, Bard, una delle tre versioni di Gemini ha superato GPT-3.5 in sei degli otto benchmark del settore, ma solo in uno il più recente GPT-4.
Tutti i dettagli.
COSA SA FARE GEMINI (ANCHE RISPETTO ALL’UOMO)
Google l’ha definita l’IA “più grande e più capace”. Gemini è un modello linguistico di grandi dimensioni (LLM) multimodale, cioè è in grado di comprendere diversi tipi di informazioni, tra cui testo, audio, immagini e video.
Rispetto agli umani, secondo quanto dichiarato dai dirigenti di Google, la versione più avanzata di Gemini “è il primo modello a superare gli esperti umani in MMLU (massive multitask language understanding), una misurazione che verifica materie come matematica, storia, legge ed etica”.
NON 1 MA 3 VERSIONI
Gemini sarà disponibile in tre modelli: Gemini Ultra, il più grande e il più capace per eseguire compiti altamente complessi; Gemini Pro, il migliore per la scalabilità di un’ampia gamma di attività; e, infine, Gemini Nano, il più efficiente per le attività on-device, ovvero per gli utenti Android che desiderano creare applicazioni basate su Gemini. Ad esempio, spiega Google, con Gemini Nano è possibile riassumere le registrazioni effettuate con l’app Recorder sul telefono Pixel 8 Pro (ma solo in inglese).
La Big Tech ha infatti sottolineato che il suo modello linguistico è “più flessibile” perché in grado di funzionare in modo efficiente su ogni tipo di dispositivo, dai data center ai dispositivi mobili.
Per ora Bard è alimentato da Gemini Pro, ma dall’anno prossimo sarà integrato con la versione Ultra. Secondo le anticipazioni, nei mesi a venire, l’azienda aggiungerà Gemini ad altre applicazioni, tra cui la ricerca, Google Ads e il browser Chrome.
Il colosso guidato da Sundar Pichai ha inoltre fatto sapere che sta studiando come trarre profitto dalla sua IA, ma non ha ancora “nulla di specifico da condividere”.
COME SI POSIZIONA RISPETTO A CHATGPT
Il termine di paragone però è sempre con ChatGPT di Sam Altman, che per primo ha dato avvio a questa rivoluzione tecnologica. E stando a Quartz, le recenti valutazioni di Google su Gemini suggeriscono che “l’azienda ha ancora molta strada da fare per eguagliare o superare le offerte di OpenAI”.
Infatti, come dichiarato dalla stessa Google, Gemini Ultra (la sua versione IA più avanzata) ha superato GPT-3.5 in sei degli otto benchmark del settore, ma solo in uno il più recente GPT-4. In particolare, stando a un white paper di Google, la versione più potente di Gemini ha superato il GPT-4 in esami a scelta multipla, in matematica alle elementari e in altri benchmark, ma ha riconosciuto le difficoltà che si incontrano nella capacità di ragionamento di livello superiore.
Alla domanda se Gemini avesse allucinazioni come gli altri chatbot, Eli Collins, vicepresidente del prodotto presso DeepMind di Google, ha confermato che gli LLM “le hanno ancora”.
GLI EFFETTI ECONOMICI DELL’IA SU GOOGLE E MICROSOFT
Nonostante l’attesa che ha circondato Gemini negli ultimi mesi, le azioni di Alphabet (società madre di Google), scrive AP, “sono scese leggermente nelle contrattazioni di mercoledì”. Tuttavia, anche Alphabet, cavalcando l’onda dell’entusiasmo per l’IA, quest’anno ha finora aumentato il suo valore di mercato di oltre 500 miliardi di dollari, pari a circa il 45%.
E per Microsoft, riferisce l’agenzia di stampa, l’alleanza con OpenAI è stata fino a oggi “una manna”, facendo salire, nel suo caso, il valore di mercato di oltre il 50% quest’anno, soprattutto grazie alla convinzione degli investitori che l’IA “si trasformerà in una miniera d’oro per l’industria tecnologica”.