La corsa all’intelligenza artificiale non conosce sosta e tutto può cambiare da un momento all’altro. Google, per esempio, ha appena annunciato alcune informazioni sui suoi ultimi modelli di IA, Gemini 1.5 Flash e 1.5 Pro, che potrebbero tenere sulle spine OpenAI.
L’azienda guidata da Sam Altman e finanziata da Microsoft ha dato il via alla gara e lanciato prodotti di successo come ChatGpt e le sue versioni aggiornate e potenziate, ma ora Big G afferma di poter battere i suoi modelli.
COSA POSSONO FARE GEMINI 1.5 FLASH E 1.5 PRO
Gemini 1.5 Flash è stato presentato per la prima volta al Google I/O di maggio ed è stato disponibile in anteprima – ovvero i clienti hanno potuto testare il prodotto e fornire feedback – durante l’ultimo mese. Ora a è ufficialmente disponibile per il grande pubblico.
Questo modello, secondo quanto dichiarato dall’azienda, è in grado di analizzare un’ora di video, 11 ore di audio o più di 700.000 parole in un’unica query, senza che gli utenti debbano suddividere le loro domande in più parti. Nel corso di una presentazione ai giornalisti, Google ha mostrato come il bot possa analizzare un video di 14 minuti in un solo minuto.
Gemini 1.5 Pro può addirittura raccogliere ancora più contesto, è infatti in grado di analizzare 22 ore di audio e 1,5 milioni di parole. “È possibile ragionare sulla storia di un’intera azienda, che potrebbe essere costituita da 10 anni di bilanci” in un’unica domanda, ha dichiarato Thomas Kurian, Ceo di Google Cloud.
SPEEDY GOOGLE
Ma stando a Google i suoi ultimi modelli non solo hanno una maggiore capacità informativa, per cui gli utenti possono includere molto più contesto audio, video, codice o testo nelle loro domande e ottenere risposte apparentemente più accurate. Anche la rapidità, nel paragone con i prodotti di OpenAI, è superiore.
Gemini 1.5 Flash infatti sarebbe più veloce del 20% rispetto a Gpt-4o e del 40% in confronto a Gpt-3.5-turbo.
RAPPORTO QUALITÀ/PREZZO
Gemini 1.5 Flash è disponibile gratuitamente per gli sviluppatori in una versione limitata e a prezzi variabili a seconda della quantità di dati che gli utenti vogliono inserire. Per Kurian, si tratta del “modello più veloce con il miglior rapporto prezzo/prestazioni sul mercato”.
Gemini 1.5 Pro, invece, è circa 10 volte più costoso, ma viene descritto da Google come il suo “modello migliore in assoluto”.
Come riferisce Quartz, i profitti di Google nel primo trimestre 2024 sono cresciuti del 60% in parte proprio grazie all’intelligenza artificiale.
I CLIENTI CHE LO HANNO GIÀ SCELTO
Secondo Google i recenti aggiornamenti di Gemini 1.5 Flash, 1.5 Pro e del generatore di immagini Imagen 3 rendono il suo pacchetto di software di intelligenza artificiale “la piattaforma di IA generativa più pronta per le aziende” sul mercato. E per ora sembrano essere d’accordo UberEats, Moody’s e Shutterstock, i quali stanno già utilizzando i suoi prodotti.
Stando a Quartz, la loro scelta è ricaduta su Google “in parte grazie a un nuovo aggiornamento particolare della sua intelligenza artificiale: l’accelerazione delle capacità di grounding “.
IL GROUNDING NELL’IA, OVVERO L’ATTENDIBILITÀ
Il grounding nell’IA generativa è la capacità di collegare i risultati del modello a fonti di informazione verificabili e i modelli Gemini mostrano ora le risposte collegate a una fonte con un link. A queste risposte viene attribuito anche un punteggio di attendibilità.
“Questi elementi sono progettati per migliorare la fattualità e ridurre sostanzialmente l’allucinazione”, ha spiegato Kurian, parlando delle nuove funzioni di fact-checking dell’azienda.
A tal proposito Google ha dichiarato che nel terzo trimestre lancerà anche un nuovo strumento di grounding specifico per il settore finanziario che, per esempio, consentirà agli analisti di basare le loro query IA sui dati di Moody’s o agli esperti legali di basare le domande sulle fonti dell’agenzia di stampa Reuters.