G4Media.ro

OpenAI lansează un nou model de generare video, denumit Sora. Compania de…

Sursa foto: Unsplash / Zac Wolff

OpenAI lansează un nou model de generare video, denumit Sora. Compania de inteligență artificială spune că Sora poate crea scene realiste și pline de imaginație pornind de la instrucțiuni text

OpenAI a prezentat noul său modelul de inteligență artificială text-to-video, „Sora”. Compania spune că Sora „poate crea scene realiste și pline de imaginație pornind de la instrucțiuni text”. Modelul text-to-video le permite utilizatorilor să creeze videoclipuri fotorealiste de până la un minut – totul pe baza unor instrucțiuni scrise, relatează theverge.com

Sora este capabil să creeze „scene complexe cu mai multe personaje, tipuri specifice de mișcare și detalii precise ale subiectului și ale fundalului”, potrivit postării introductive de pe blogul OpenAI. De asemenea, compania notează că modelul poate înțelege modul în care obiectele „există în lumea fizică”, precum și „să interpreteze cu acuratețe recuzita și să genereze personaje convingătoare care exprimă emoții vibrante”.

Șablonul poate, de asemenea, să genereze un videoclip dintr-o imagine statică, precum și să completeze cadrele lipsă dintr-un videoclip existent sau să îl extindă.

Demonstrațiile generate de Sora incluse în postarea de pe blogul OpenAI includ o scenă aeriană din California în timpul goanei după aur, un videoclip care pare a fi fost filmat din interiorul unui tren din Tokyo și multe altele. Multe dintre ele prezintă unele semne revelatoare de inteligență artificială – cum ar fi o podea care se mișcă suspect de mult într-un videoclip dintr-un muzeu – iar OpenAI spune că modelul „poate avea probleme în a simula cu acuratețe fizica unei scene complexe”, dar rezultatele sunt în general destul de impresionante.

În urmă cu câțiva ani, generatoarele text-imagine, precum Midjourney, se aflau în fruntea capacității modelelor de a transforma cuvintele în imagini. Dar, recent, video a început să se îmbunătățească într-un ritm remarcabil: companii precum Runway și Pika și-au dezvăluit propriile modele impresionante de transformare a textului în video, iar Lumiere de la Google pare a fi unul dintre principalii concurenți ai OpenAI și în acest spațiu. Similar cu Sora, Lumiere le oferă utilizatorilor instrumente de transformare a textului în video și le permite, de asemenea, să creeze videoclipuri pornind de la o imagine fixă.

Susține-ne activitatea G4Media logo
Donație Paypal recurentă

Donează lunar pentru susținerea proiectului G4Media

Donează prin Transfer Bancar

CONT LEI: RO89RZBR0000060019874867

Deschis la Raiffeisen Bank
Donează prin Patreon

Donează

Citește și...

1 comentariu

  1. Cred ca progresul tehnologic este prea rapid. Este pentru un numar foarte.mic de oameni si schimbarile sunt atat de rapide ca nici nu e timp ca o companie sa se imbogateasca. Efectiv se toaca bani dar nu intra atat de multi.