«Яндекс» представил бета-версию своей новой нейросети YandexART (Vi), которая может генерировать короткие ролики продолжительностью в пять секунд. Эта нейросеть умеет реалистично передавать движения объектов, будь то морские волны, человек или животное.
На практике, YandexART (Vi) может быть полезна для создания анимированных обоев для телефона или материалов для блогеров и творческих специалистов. Доступ к ней можно получить через приложение «Шедеврум».
Прошлая версия нейросети, выпущенная «Яндексом» в августе прошлого года, тоже генерировала видео по текстовому запросу. Однако, та версия фокусировалась на движении камеры, а не объектов, из-за чего изображения на разных кадрах могли значительно отличаться друг от друга.
YandexART (Vi) отличается тем, что умеет воспроизводить плавные и естественные движения, сохраняя согласованность между кадрами. Это стало возможным благодаря обучению модели на роликах с движущимися объектами, например, автомобилями или крадущимися кошками.
Чтобы создать видео, пользователю достаточно описать текстом, что он хочет увидеть. Нейросеть сначала генерирует изображение, которое станет отправной точкой анимации, а затем превращает цифровой шум в последовательность кадров, основываясь на этом изображении и заданном запросе.