Google Cloud, la divisione del gruppo Alphabet dedicata al cloud computing, ha presentato la sua nuova generazione di Tpu (da Tensor Processing Unit), una tipologia di microprocessori progettata per eseguire rapidamente i calcoli nei modelli di intelligenza artificiale. La nuova linea si articola in due versioni, ognuna pensata per svolgere un compito preciso: la Tpu 8t è infatti destinata all’addestramento dei modelli linguistici, mentre la Tpu 8i verrà utilizzata per l’inferenza, cioè la fase in cui il modello risponde alle richieste degli utenti.
I DETTAGLI SULLE TPU DI GOOGLE
Le due nuove Tpu riescono a memorizzare più informazioni, permettendo così al sistema di intelligenza artificiale di fornire risposte più rapidamente. “Si tratta di fornire la latenza di risposta più bassa possibile al minor costo possibile per transazione”, ha spiegato Mark Lohmeyer, vicepresidente dell’unità di Google per l’infrastruttura di calcolo e l’intelligenza artificiale. “Il numero di transazioni sta aumentando notevolmente e il costo per transazione deve diminuire in modo significativo affinché il sistema sia scalabile”.
La Tpu 8t, quella per la fase di addestramento, può essere combinata in gruppi di 9600 semiconduttori. Google ha spiegato che, quando si implementano sistemi così imponenti, il vincolo principale sta nella fornitura energetica: da qui la necessità, per gli sviluppatori di intelligenza artificiale, di componenti sempre più efficienti che possano trarre il massimo da una disponibilità di elettricità limitata. La Tpu 8t garantisce allora una prestazione per watt (cioè quanta potenza di calcolo si ottiene per unità di energia consumata) superiore del 124 per cento rispetto alla generazione precedente, mentre la Tou 8i offre un aumento del 117 per cento.
Google ha detto anche che l’incremento delle prestazioni è possibile dal miglioramento del networking interno, cioè l’infrastruttura che collega i processori tra loro, aumentando l’efficienza degli scambi di dati.
Le due Tpu saranno disponibili nei prossimi mesi del 2026: non è stata fornita una data più precisa.
LA COMPETIZIONE CON NVIDIA SUI MICROCHIP PER L’INTELLIGENZA ARTIFICIALE
L’annuncio delle nuove Tpu è un esempio del rafforzamento della posizione di Google in un mercato – quello dei processori per l’intelligenza artificiale – dominato da Nvidia.
Le unità di elaborazione grafica (Gpu) di Nvidia sono richiestissime per via delle loro prestazioni, ma hanno prezzi elevatissimi: anche 40.000 dollari l’una. Ecco perché Google – ma non è l’unica a puntare su questa strada – ha iniziato a sviluppare internamente delle alternative proprie, in modo da ottimizzare i costi e le prestazioni dei propri servizi di cloud computing, pur senza rinunciare ai dispositivi di Nvidia.
Sia Google che Nvidia, peraltro, si stanno concentrando parecchio sulla fase di inferenza delle applicazioni di intelligenza artificiale (i requisiti sono velocità di risposta e basso costo per transazione), mentre in passato il focus era sull’addestramento dei modelli linguistici.
NON SOLO TPU: LE MOSSE DI GOOGLE SUGLI AGENTI DI INTELLIGENZA ARTIFICIALE
Oltre all’hardware, mercoledì Google Cloud ha presentato anche dei software per le imprese capaci di creare degli agenti di intelligenza artificiale – cioè dei sistemi progettati per svolgere compiti ed eseguire azioni in modo autonomo – di personalizzarli e di monitorarne il lavoro.
La società, inoltre, ha lanciato un fondo da 750 milioni di dollari per aiutare le società di consulenza a diffondere gli agenti di intelligenza artificiale tra i loro clienti. Alcune di queste società otterranno anche un accesso anticipato ai modelli della famiglia Gemini.







