Evidentemente non soddisfatte dall’aver già messo a rischio, con i loro algoritmi sempre più smart, il lavoro di traduttori, programmatori, musicisti, sviluppatori di videogames, sceneggiatori, giornalisti e perfino attori, le Big Tech ora caricano a testa bassa anche il redditizio mondo dei podcast, uno degli indiscussi fenomeni mediatici di questo periodo.
L’IA DI GOOGLE FARA’ PODCAST?
La minaccia per la precisione arriva da Google che ha appena lanciato un nuovo strumento chiamato Audio Overview che utilizza gli ultimi ritrovati nel campo dell’Intelligenza artificiale per creare podcast basati su contenuti caricati dagli utenti tramite NotebookLM.
COME FUNZIONA AUDIO OVERVIEW
Audio Overview è animato dal modello Gemini 1.5 di Google e, secondo quanto promette la multinazionale statunitense, dovrebbe permettere a tutti gli utenti di creare podcast senza nemmeno servirsi di un microfono, semplicemente caricando contenuti da file testuali, eventualmente Pdf, ma pure fonti video o link a siti internet tracciando una scaletta fatta di domande, punti da toccare e riassunti.
Il podcast vero e proprio lo crea e lo speakera l’Intelligenza artificiale di Google, inserendo voci maschili e femminili che discutono il materiale caricato. Si tratta naturalmente di un ulteriore passo avanti nelle capacità mostrate dall’Ia dal momento che, oltre alle ben note possibilità di riassumere testi e ordinare dati ed eventi con filo logico, argomentando, qui gli algoritmi enfatizzeranno vocalmente quanto elaborato, recitando di fatto un copione.
This is amazing.
In less than 10 minutes, I grab all of Great Gatsby and generate a summary, study guide, Q&A bot, and podcast about it.
My team is on the floor, rolling with laughter right now. pic.twitter.com/avCUP67zLt
— Allie K. Miller (@alliekmiller) September 25, 2024
Non è la prima volta che l’Intelligenza artificiale prova a emulare l’enfasi del parlato: ChatGpt ormai parla in italiano ed è possibile apprezzarne le sfumature nel timbro di voce nel tentativo di imitare il più possibile caratteristiche umane come le cadenze, le insicurezze, gli intercalari, il tono stentoreo o agitato e via discorrendo. Si tratta di risultati tutt’altro che impeccabili ma assai differenti dal parlato monocorde degli assistenti vocali diffusi fino a oggi come Alexa o Ehi Google, dalla parlata in stile cancellazioni e annuncio ritardo di Trenitalia.
NUOVI INTERROGATIVI
In Rete è già possibile trovare e ascoltare esempi delle potenzialità del nuovo strumento, al momento disponibile unicamente in lingua inglese e i risultati paiono molto interessantI.
Tutto ciò spalanca però la porta a nuovi interrogativi che riguardano possibili attività di scraping (quali dati sono stati usati per allenare l’Ia di Google? Quali tracce audio le hanno insegnato a imitare così bene il parlato umano?) fino all’uso in possibili truffe.
Così come l’Intelligenza artificiale che elabora testi scritti può creare fake news credibili e quella che crea fotomontaggi può essere usata per falsi d’autore, allo stesso modo un algoritmo capace di parlare potrebbe simulare telefonate e messaggi vocali per scopi tutt’altro che leciti.