Mini ma più potente e più economico. Così OpenAI definisce il suo ultimo modello di intelligenza artificiale (IA), Gpt-4o mini. Una rivisitazione di Gpt-4o, dove la ‘o’ finale sta per omnia. L’ultimo arrivato ha l’obiettivo di rendere questa tecnologia più accessibile e meno dispendiosa dal punto di vista energetico, consentendo alla software house di rivolgersi a un bacino più ampio di clienti.
UN’IA PIÙ CONVENIENTE
Al prezzo di 15 centesimi per milione di token di input e 60 centesimi per milione di token di output, Gpt-4o mini – a detta della casa madre di ChatGpt – è più economico di oltre il 60% rispetto a Gpt-3.5 Turbo. Un token, nel caso del sistema di OpenAI, è una sequenza di 4 caratteri e l’ultimo modello ha una finestra di contesto di 128.000 token.
Attualmente supera Gpt-4 nelle preferenze di chat e ha ottenuto un punteggio dell’82% nel Massive Multitask Language Understanding, un benchmark di intelligenza testuale e ragionamento utilizzato per valutare le capacità dei modelli linguistici. Più alto è il punteggio più il modello è in grado di comprendere e utilizzare meglio il linguaggio in una varietà di domini.
Il modello mini – che ha una conoscenza fino a ottobre 2023 – a oggi supporta testo e visione nell’interfaccia di programmazione dell’applicazione, ma OpenAI ha dichiarato che in futuro sarà disponibile il supporto per input e output di testo, immagini, video e audio.
“Quello che vediamo sempre più spesso sul mercato è che gli sviluppatori e le aziende combinano modelli piccoli e grandi per ottenere la migliore esperienza possibile in termini di prodotto, a un prezzo e una latenza che sia giusta per loro”, ha commentato Olivier Godement, il product manager dell’azienda responsabile del nuovo modello, spiegando che le esigenze dei clienti stanno cambiando.
MODELLI A CONFRONTO
Stando a quanto dichiarato dall’azienda guidata da Sam Altman, il punteggio di Gpt-4o mini si confronta con il 77,9% di Gemini Flash di Google e il 73,8% di Claude Haiku di Anthropic. I modelli linguistici più piccoli richiedono una minore potenza di calcolo per essere eseguiti, il che li rende un’opzione più accessibile per le aziende con risorse limitate che desiderano implementare l’IA generativa nelle loro attività.
SARÀ PIÙ SOSTENIBILE?
OpenAI non fa riferimento al dispendio di energia necessario per Gpt-4o mini, ma Reuters afferma che uno degli obiettivi dell’azienda è rendere la sua tecnologia, oltre che più accessibile, “meno dispendiosa dal punto di vista energetico”. Il consumo energetico degli strumenti di intelligenza artificiale generativa infatti è fuori controllo e anche l’impatto idrico non è irrilevante.
Come scrive Wired, “Google ha recentemente smesso di considerarsi neutrale dal punto di vista delle emissioni di anidride carbonica e Microsoft potrebbe accantonare i suoi obiettivi di sostenibilità a favore della corsa alla costruzione di tool più grandi e performanti”. Il consumo totale di energia di Google è raddoppiato dal 2019 al 2023, così come quello di acqua utilizzata dai data center.
Anche l’Agenzia internazionale dell’energia a gennaio ha pubblicato le sue previsioni sull’utilizzo di energia a livello mondiale nei prossimi due anni. Per la prima volta sono state incluse le proiezioni relative al consumo di elettricità associato ai data center, alle criptovalute e all’intelligenza artificiale. L’Agenzia stima che, sommati insieme, questi usi rappresentavano quasi il 2% della domanda globale di energia nel 2022 – e che la domanda potrebbe raddoppiare entro il 2026, il che la renderebbe all’incirca pari alla quantità di elettricità utilizzata dal Giappone.