Вероятно вече чували за невероятните резултати, постигнати от изкуствен интелект за текст към изображение, като Dall-E, Stable Diffusion и Midjourney. В края на миналата година, Meta направиха няколко опота, демонстрирайки, че същото е възможно и от текст към видео. Google също работят за постигането на интригуващи резултати, но както е известно – в началото тази усъвършенствана технология не е достъпна за обществеността. Има обаче едно изключение: QuickVid.

Преди очакванията ви да станат твърде високи, важно е да осъзнаете, че това не е еквивалентно на генерирането на хиляди неподвижни изображения със стабилна дифузия и сглобяването им за създаване на видео или получаване на достъп до най-модерните AI системи в света за истинско видео генериране. Това е много ранно влизане в надпреварата за решение за текст към видео. 
Началото е лесно – задайте изискванията си и изкуственият интелект ще се опита да генерира скрипт по него. След това AI написва малко “по-подробен” разказ, а той се разразва благодарение на синтезиран мъжки или женски глас. Последната стъпка разкрива как QuickVid наслагва скрипта като заглавия и добавя миниатюрни изображения, генерирани от Dall-E API.  
В интервю за TechCrunch разработчикът на QuickVid споделя, че предстоят подобрения, като повече опции за персонализиране пристигат през януари. В крайна сметка QuickVid ще включва и надписи и поддържащи аватари. Ако потребителите решат, че си заслужава, може да се появят още много различни варианти, включващи AR и VR. 

Снимки:Unsplash

Виж още: Запознайте се със София: роботът, който се шегува с унищожаването на човечеството 



Източник