Разработчик заставил нейросеть рисовать графику для своей ASCII-RPG в реальном времени

Инди-разработчик Джефф Шомей провел интересный эксперимент, в рамках которого он использовал возможности искусственного интеллекта для генерации графики своей ASCII-RPG под названием Thunder Lizard в реальном времени. Его главной целью было выяснить, возможно ли превратить простую символьную графику в полноценное визуальное оформление прямо во время игрового процесса.

Основной проблемой на пути к реализации этой идеи стала задержка. Для комфортной игры требуется высокая скорость обработки кадров, тогда как большинство современных нейросетей для генерации изображений работают слишком медленно. Шомей перепробовал множество различных моделей и техник, пытаясь найти компромисс между качеством картинки и скоростью ее создания.

В итоге разработчик остановился на одной из быстрых моделей, которая позволила добиться частоты около 10 кадров в секунду при задержке примерно в одну секунду. По его словам, это пока что лучший результат, обеспечивающий баланс между визуальной составляющей и играбельностью. Эксперименты с более продвинутыми и качественными моделями, включая собственную обученную LoRA, приводили к созданию гораздо более приятного изображения, однако задержка возрастала до четырех секунд, что делало игру практически неиграбельной.

Шомей также столкнулся с проблемой отсутствия стабильности между кадрами. Нейросеть могла на одном кадре нарисовать дерево, а на следующем на том же месте сгенерировать камень, что создавало неприятный мерцающий эффект. Несмотря на существующие трудности, разработчик считает свой эксперимент успешным.

20
7
Комментарии:  7
Ваш комментарий

Даже на видео чётко показано, что такая реализация не поддерживает микроконтроль и упускает детали. Чисто для роликов каких-нибудь или фона - нормально, но в игре, где существуют интерактивные и просто важные информационные элементы, вшитые в окружающий мир, это критично.

плоха тупа выглядит
а так была бы интересна заделать такую игру чтоб короче 3д экшон. рендерит описатильные данные для нейронной сети. а крутая сеть делает или стилизованный графон или как в жизни пытается. только чтоб как в жизни работало эта нужно как то точно освещение расчитывать. без этого будет что уровня предренрендеров наверна. толька нейросеть должна быть очень круая для этого а пока нейросеть очень тупая. думает буквами а не глазами и визуальными образами.

Гений (третий) уже есть, и все продолжает совершенствоваться.
https://www.youtube.com/watch?v=YvuEKrJhjos

Словно художники закинулись и рисуют контуженной рукой.

Чел изобрёл геймдев будущего. ДЛСС уже это делает силами RT ядер, только используя готовую картину и рисуя только транзишны. Если я окажусь прав, хороните 2040-е года в плане продукта. Авторский контент будет на вес золота и стоить будет как технологии, либо умрёт за ненадобностью - не останется потребителей, способных оценить или отличить нейрогон от человеческой руки, а люди уйдут в андеграунд комьюнити вокруг медийных творцов и инди так, что разрыв между потребительским продуктом и людским обществом искусства будет такой же, как разрыв между власть имущими и средними гражданами цивилизованной страны в вопросах мироощущения и восприятия.

Не стоит преувеличивать, подавляющему большинству плевать, что они потребляют.