Skip to content

agenti ai

Gli agenti AI sono realmente intelligenti?

Anche una semplice operazione come prenotare un pranzo o una cena al ristorante rischia di mandare in tilt gli agenti AI sviluppati per affiancarci (sostituirci?) nella maggior parte dei compiti. Sono risultati di un test che dovrebbero far riflettere soprattutto quei datori di lavoro che vorrebbero diminuire il personale per imbarcare in azienda l'Intelligenza artificiale...

Sono sempre più le persone che ostentano di affidare parti via via più importanti delle proprie mansioni agli agenti AI, ma questi algoritmi smart sono davvero affidabili, specie quando si tratta di cooperare tra loro? Secondo quanto rivelato dalla stessa Microsoft, tra le software house maggiormente impegnate nel settore dell’Intelligenza artificiale (nonché tra le più importanti finanziatrici di OpenAi di Sam Altman), la strada da percorrere perché si arrivi a risultati soddisfacenti sarà ancora parecchio lunga.

Microsoft ha dichiarato di aver messo alla prova diversi agenti AI in un ambiente simulato chiamato Magnetic Marketplace in un esperimento condotto in collaborazione con l’Arizona State University finalizzato a comprendere se l’algoritmo possa realmente agire in autonomia senza l’intervento degli esseri umani. L’esame ha coinvolto 100 agenti cliente e 300 agenti aziendali basati su modelli come Gpt-4o, Gpt-5 e Gemini-2.5-Flash.

TEST BANALE, AGENTI AI IN TILT

La verifica prevedeva che un gruppo di “agenti ai cliente” dovesse simulare l’ordine di una cena inoltrandolo a ristoranti virtuali gestiti da altri algoritmi intelligenti. I primi avrebbero dovuto controllare i prezzi, verificare eventuali offerte e disponibilità restando all’interno dei comandi ricevuti dal proprio controllore umano mentre i secondi avviare e concludere la transazione nel modo più efficiente possibile, fornendo risposte alle domande degli avventori.

Una situazione piuttosto standard per un essere umano ma che ha portato al tilt degli algoritmi: alcuni sono rimasti impantanati in una indecisione cronica rispetto all’offerta, tutti avrebbero dimostrato una forte incapacità di cooperazione ma soprattutto i risultati del test hanno messo in luce una sorprendente vulnerabilità alla manipolazione: gli agenti AI clienti venivano infatti persuasi con facilità dai gestori dei ristoranti a ordinare cibi non richiesti dal prompt originario, spendendo più del dovuto. Non solo: non sono nemmeno enciclopedici come dovrebbero: è accaduto per esempio che credessero a un ristorante che dichiarava falsamente di essere stato menzionato nella Guida Michelin.

Non si tratta di un fenomeno sconosciuto. Come ricorda PCMag, in un recente tweet Dane Stuckey di OpenAI ha ammesso che il suo browser ChatGPT Atlas può acquistare il prodotto sbagliato per conto degli utenti. 

COSA CI INSEGNA QUESTO ESAME?

Il test è sicuramente prezioso e mette in luce non solo il fatto che al momento gli agenti AI non possono sostituire ancora gli umani nemmeno nelle mansioni apparentemente meno ostiche, ma che l’Intelligenza artificiale, se lasciata libera di agire, difficilmente prende decisioni sensate, allontanandosi da ogni logica.

Ece Kamar, direttrice del laboratorio AI Frontiers di Microsoft Research, ha ammesso che “più opzioni vengono offerte, più i modelli si sovraccaricano e perdono efficacia”. Un problema non di poco conto, considerato che anche una operazione semplice e quotidiana come prenotare una cena può presentare incognite alle quali i modelli di intelligenza artificiale non sembrano preparati.

Gli agenti AI peccherebbero insomma di attitudine al problem solving e di capacità al lavoro in team: caratteristiche richieste nella maggior parte dei lavori. Mancanze che sembrerebbero al momento scudare l’essere umano dal rischio di vedersi soffiare il lavoro da un algoritmo, eppure i numeri paiono suggerire che sono diverse le aziende nelle quali entra l’Intelligenza artificiale e viene sbattuto fuori l’impiegato.

Torna su