Vidu, генеративната видео платформа от базираната в Пекин ShengShu Technology, представи надстройка с пускането на Vidu Q1. Базираният на браузъра генериращ видео модел превръща две неподвижни изображения и текстова подкана в пет секунди, 1080p кинематографичен клип. Неговата система „От първия до последния кадър“ направлява плавно движението между несвързани кадри, като дава на соло създателите достъп до преходи, които някога са изисквали професионални VFX екипи. Аудиото вече също е включено в работния процес. Vidu Q1 генерира 48 kHz фонова музика и звукови ефекти чрез текст, поддържа десет секунди многоканално наслояване и отговаря на сигнали с времеви щампи, елиминирайки необходимостта от външни звукови библиотеки. Резултатите в аниме стил също са се подобрили, с по-ясни линии и по-добра последователност на рамката, казаха от компанията. Вътрешните показатели поставят Q1 пред Sora, Runway Gen-2 и Luma Dream Machine на OpenAI по отношение на бързата прецизност и кохерентност на кадрите, докато съперниците все още разчитат на външни инструменти за аудио или по-дълго време за рендиране. Основана през март 2023 г., ShengShu Technology е базирана в Пекин AI стартираща компания, специализирана в мултимодални големи езикови модели и творчески инструменти за създатели на филми, реклама и дигитални творци. [TechNode report]

Свързани

Нашия източник е Българо-Китайска Търговско-промишлена палaта

By admin