skip to Main Content

Sora Openai

Sora di OpenAi, ecco le differenze con Emu di Meta e Lumiere di Google

OpenAI lancia Sora, lo strumento di intelligenza artificiale che crea video "realistici" e "fantasiosi" di 60 secondi da rapidi messaggi di testo. Anche Meta e Google hanno annunciato o rilasciato i propri motori di conversione testo-video. Ecco dettagli e differenze

Non si arresta la corsa  di OpenAI, la società sostenuta da Microsoft dietro il chatbot ChatGpt e il generatore di immagini fisse DALL-E, nello sviluppo di nuovi modelli di intelligenza artificiale.

L’ultimo è Sora, chiamato così dalla parola giapponese che significa cielo. Il team dietro la tecnologia di OpenAI ha scelto questo nome perché “evoca l’idea di un potenziale creativo illimitato”. Si tratta infatti di una piattaforma che permette di creare filmati fornendo al chatbot solo indicazioni testuali della durata massima di 60 secondi. Il software di generazione video segue il chatbot ChatGPT, rilasciato alla fine del 2022 e ha creato scalpore attorno all’Ia generativa con la sua capacità di comporre e-mail e scrivere codici e poesie.

Al momento Sora non è disponibile al pubblico, nemmeno in versione di prova, anche perché OpenAI deve ancora capire come proteggerla da eventuali problemi dovuti alla produzione di video falsi, fatti passare per veri. OpenAI si dichiara infatti focalizzata sulla sicurezza. La società guidata da Sam Altman ha affermato che prevede di collaborare con un team di esperti per testare l’ultimo modello e esaminare da vicino varie aree tra cui disinformazione, contenuti che incitano all’odio e pregiudizi.

Tutti i dettagli.

L’ANNUNCIO DI SORA DA PARTE DI OPENAI

In un post sul blog, OpenAI ha affermato che Sora è in grado di generare video fino a 60 secondi di lunghezza da istruzioni di testo, con la possibilità di fornire scene con più personaggi, tipi specifici di movimento e dettagli di sfondo dettagliati.

“Il modello comprende non solo ciò che l’utente ha chiesto nel prompt, ma anche come queste cose esistono nel mondo fisico”, si legge nel post sul blog, aggiungendo che può creare più inquadrature all’interno di un singolo video.

AFFRONTARE I RISCHI

Un portavoce di OpenAI ha sottolineato che non prevede di rendere Sora ampiamente disponibile in tempi brevi poiché continua a lavorare su una serie di questioni di sicurezza, compresi gli sforzi per ridurre la disinformazione, i contenuti che incitano all’odio e i pregiudizi, nonché un’etichettatura chiara l’output generato dall’intelligenza artificiale.

La società ha affermato che sta anche sviluppando strumenti in grado di discernere se un video è stato generato da Sora. Un aiuto dovrebbe arrivare dalle etichette a cui sta lavorando il consorzio C2pa, di cui fanno parte OpenAI ma anche Meta, Microsoft e Google. L’idea è inserire dati aggiuntivi che evidenzino l’eventuale creazione di un file tramite IA e bloccarne la diffusione online, qualora vengano violate le norme condivise, rileva l’Ansa.

LA CONCORRENZA CON META, GOOGLE E NON SOLO

OpenAI è tra le tante aziende che si rincorrono per migliorare questo tipo di generatore di video istantanei, comprese start-up come Runway e giganti della tecnologia come Google e Meta, il proprietario di Facebook e Instagram. La tecnologia potrebbe accelerare il lavoro dei registi esperti, sostituendo completamente gli artisti digitali meno esperti, segnala il New York Times.

Solo qualche giorno fa, Google aveva lanciato Lumiere, una piattaforma di IA simile che però crea filmati partendo da immagini caricate dall’utente. Dunque Sora non è il primo modello del genere ma è l’unico a poter generare un file lungo fino a 60 secondi. Meta ha rafforzato il suo modello di generazione di immagini Emu lo scorso anno per aggiungere due funzionalità basate sull’intelligenza artificiale in grado di modificare e generare video da istruzioni di testo.

IL COMMENTO DEGLI ESPERTI

Sebbene i “modelli multimodali” non siano una novità ed esistano già modelli da testo a video, ciò che li distingue è la lunghezza e la precisione che OpenAI afferma che Sora abbia, secondo Reece Hayden, analista senior presso la società di ricerche di mercato ABI Research, citato dalla Cnn.

Hayden ha affermato che questi tipi di modelli di intelligenza artificiale potrebbero avere un grande impatto sui mercati dell’intrattenimento digitale con nuovi contenuti personalizzati trasmessi in streaming attraverso i canali. “Un caso d’uso ovvio è all’interno della TV; creando brevi scene per supportare le narrazioni”, ha detto Hayden. “Il modello è ancora limitato, ma mostra la direzione del mercato”.

Back To Top