L’avanzata delle Intelligenze artificiali potrebbe rivoluzionare la geografia del Web. Può sembrare una asserzione fantascientifica, ma sembra esserne consapevole anche un colosso come Google, centro nevralgico della Rete così come la conosciamo oggi. Lunedì 13 maggio OpenAI (software house emergente ma abbondantemente foraggiata da Microsoft) ha alzato il velo sul suo Gpt-4o, nemmeno 24 ore dopo la risposta di Mountain View è arrivata col Google I/O 2024.
GOOGLE I/O 2024: LA PAROLA ALL’IA
Dal palco dello Shoreline Amphitheatre di Mountain View, in California, la conferenza annuale rivolta agli sviluppatori ma tradizionalmente aperta al grande pubblico ha permesso alle alte sfere di Google di sgranare il proprio rosario di prodotti e servizi che hanno tutti o quasi a che fare con Gemini.
“Investiamo nell’Intelligenza artificiale da più di dieci anni. Siamo in piena era Gemini, ma siamo solo all’inizio”, la frase con la quale il Ceo Sundar Pichai ha aperto le danze ma soprattutto ha voluto mettere il cappello sulla questione dell’Ia, competizione nella quale Microsoft con i suoi investimenti su OpenAI al momento sembra primeggiare. E allora ecco che “Google espande l’Ia nella ricerca”.
PIU’ CHE GOOGLE I/O 2024, GOOGLE IA 2024
La maggior parte dei commentatori si è focalizzata sull’iper-presenzialismo di Gemini, introdotto a forza ormai in ogni feature che Mountain View mette a disposizione di utenza e sviluppatori. Start Magazine ha invece deciso di porre l’attenzione sulla feroce disputa tra Google e OpenAI, disputa ben rappresentata da un altro prodotto.
Ecco perché questo resoconto dell’evento Google I/O 2024 ha inizio con Project Astra, vera e propria risposta a Gpt-4o di OpenAI, presentato soltanto poche ore prima dalla software house rivale. Astra si configura come un assistente digitale multimodale che elabora testo, voce e immagini in tempo reale.
Dai video mostrati dalla Big Tech statunitense sembra che Mountain View intenda spolverare periferiche rimaste di nicchia come Google Glass che permetterebbero ad Astra di vedere il mondo circostante, commentando ciò che l’utente inquadra.
GEMINI IN TUTTE LE SALSE
L’obiettivo è anche quello di far dimenticare il prima possibile il recente inciampo con le immagini, e allora ecco che con un colpo di teatro: Gemini Pro 1.5 si apre a 35 lingue, italiano compreso, in 150 Paesi per gli abbonati di Gemini Advanced.
✨ The Gemini API makes it easy for developers to build with our latest multimodal generative models. Dive into the latest Gemini API updates and features we announced at #GoogleIO. ✨ → https://t.co/BJfkhgRpsf pic.twitter.com/xOO0zUuRWS
— Google for Developers (@googledevs) May 14, 2024
Arriva poi il fratellino minore di Gemini, chiamato 1.5 Flash, che si ripromette di essere più leggero e meno costoso rispetto a Gemini 1.5 Pro, dunque più accessibile agli sviluppatori e soprattutto agli startupper che potranno sfruttare le sue caratteristiche per popolare di contenuti i propri siti o dialogare con l’utenza.
Today we launched Gemini 1.5 Flash in public preview at #GoogleIO, and Gemini 1.5 Pro will be coming with a two million tokens context window (behind waitlist). Both models are available in 200+ regions, including many countries in Europe.
Try it out → https://t.co/0cpbO4bf5a pic.twitter.com/8jXEduUpXo
— Google for Developers (@googledevs) May 14, 2024
“Gemini 1.5 Flash eccelle in attività come riassunti, conversazioni in chat, didascalie per immagini e video, estrazione di dati da documenti e tabelle lunghi e molto altro”, ha spiegato Demis Hassabis, Ceo di Google DeepMind. Troverete Gemini pure in Google Foto con la funzione “Ask”, attraverso la quale il sistema vi pescherà dall’archivio la foto richiesta risparmiandovi il tempo di scartabellarle una a una.
E dato che il terreno è di quelli minati, trattandosi di applicare algoritmi che divorano dati a una sfera privata come quella di immagini e video ricordo, Google ha subito voluto prevenire eventuali critiche e rassicurare: “Le vostre foto e i vostri video non vengono mai utilizzati per la pubblicità. E nessuno esaminerà le vostre conversazioni”, ha sottolineato il colosso hi-tech.
VEO SFIDA SORA
Sempre in tema di Ia, altre due declinazioni degli algoritmi smart sono Veo e Imagen 3 attraverso i quali Google rinnova la propria sfida a Sora di OpenAI. Veo infatti permette di creare video di oltre un minuto sulla base di prompt testuali, con la promessa che non inciamperà laddove le Intelligenze artificiali si sono rivelate più fallaci: la riproduzione della fisica. Imagen 3, migliora l’Ia di Google per la creazione di immagini, sempre a partire da indicazioni scritte.
GOOGLE SI È ARROCCATA A MOUNTAIN VIEW?
Insomma, sono davvero numerose le novità “intelligenti” cucinate da Google. La sensazione costante provata assistendo all’evento, però, è che quest’anno la principale piazza del Web sia di colpo un pochino più periferica e giochi in difesa.
Pare che Google si sia arroccata in Mountain View: nessuna novità degna di tal nome, solo un lungo elenco di software che, in qualche modo, replicano a quanto già proposto o anche solo annunciato dagli avversari, sempre più numerosi e agguerriti. La battaglia delle Ia riuscirà a rivoluzionare la Rete e i suoi protagonisti? Solo il futuro – e le intelligenze artificiali – possono rispondere a questo interrogativo.