OpenAI a lansat Sora, chatbot-ul care produce, la cerere (text-to-video), clipuri video

duminică, februarie 18, 2024 9:24
Posted in category IT

Sora, chatbot text-to-video

AI-ul (Artificial Intelligence – Inteligenţă Artificială) mai face un pas spre schimbarea paradigmei lumii în care trăim, prin lansarea, joi, 15 februarie 2024, a unui nou chatbot care, de această dată, poate produce clipuri video pe baza unei descrieri a utilizatorului.

OpenAI, compania ce a lansat ChatGPT – chatbot-ul care a crescut exponenţial în popularitate începând cu noiembrie 2022 – şi DALL-E, un chatbot care poate genera imagini dintr-o descriere text, ei bine, Open AI propune, în februarie 2024, un model nou-nouţ de chatbot, numit Sora, de această dată pentru a genera clipuri video pe baza unei descrieri.

Deocamdată Sora poate genera clipuri cu durata de până la un minut, dar este doar un început. Calitatea clipului pare în regulă, mai ales că orice început este dificil.

Sora poate aborda scene complexe, cu mai multe personaje, cu tipuri specifice de mișcare și detalii deosebite, ce trebuie precizate de utilizatorul care-şi doreşte un clip video realizat de inteligenţa artificială.

Au mai existat încercări de realizare a unui chatbot capabil să genereze clipuri video – precum Gen-2, lansat în martie 2023 de către Runaway AI -, dar Sora este de departe cel mai reuşit (Gen-2 are secvenţele video distorsionate). Modelul propus de OpenAI, Sora, poate genera videoclipuri fluide, făcând ca fiecare clip generat să pară extras dintr-un film produs la Hollywood.

OpenAI spune că Sora este un model capabil să producă rezultate de înaltă calitate utilizând o arhitectură similară cu modelele GPT, precum și cu cercetările anterioare din modelele DALL-E și GPT. Pe lângă generarea video din text, Sora poate genera video dintr-o imagine statică sau poate completa cadrele lipsă din videoclipuri.

Sora este disponibil, deocamdată, pentru membrii unei echipe de probă, care vor aprecia ce trebuie corectat, și pentru un număr selectat de creatori, cum ar fi artiști vizuali, designeri și realizatori de film, pentru a colecta feedback despre cum să îmbunătățească modelul pentru a satisface nevoile lor.

Se pare că intrăm într-o nouă eră, în care companiile își vor concentra atenția asupra cercetării, dezvoltării și lansării de chatbot-uri AI text-to-video. Cu doar două săptămâni în urmă, Google Research a publicat o lucrare de cercetare despre Lumiere, un model de chatbot text-to-video care poate crea, de asemenea, videoclipuri extrem de realiste.

Citeşte şi articolele:

Sigla A7
Dacă ţi-a plăcut articolul, ai ceva de completat sau ai ceva de reproşat (civilizat) la acest text, scrie un comentariu, ori pune un link pe site-ul (blogul) tău, în cazul în care vrei ca şi alţii să citească textul sau (obligatoriu) dacă ai copiat articolul parţial sau integral. După ce ai scris comentariul, acesta trebuie aprobat de administratorul site-ului, apoi va fi publicat.

Adauga un comentariu