Искусственный интеллект в прямом эфире играет в Super Mario Bros

Четыре дня назад пользователь YouTube под ником Einfach nerdig запустил стрим. Он идет без остановок все эти дни. И все это время на экране искусственный интеллект учится играть в Super Mario Bros с NES. Создал программу MarI/O с помощью нейросетей и генетических алгоритмов парень под ником SethBling.

Он является обладателем мирового рекорда по спидрану игры Super Mario World. И первую нейросеть натаскивал именно по ней, скармливая ей свои прохождения. Сперва программа даже не понимала, как двигаться в игре: первые симуляции вовсе происходили без движения. 24 часа и огромное количество попыток спустя ИИ смог закончить первый уровень.

В нынешней обучающей сессии ИИ сотни раз в час проходит одни и те же уровни, чтобы подобрать оптимальный маршрут. Заметно, что программа еще учится, потому как усатый водопроводчик может просто застрять, уткнувшись в препятствие на несколько секунд. Правда, уровни он проходит все равно чертовски быстро.

К сожалению, видео запрещено встраивать на сторонние сайты, а потому за ним стоит проследовать на YouTube (ссылка выше). Но оно того стоит.

Нравится7
Комментарии (14)
  • пока ии тупой, просто бежит и иногда прыгает
  • Правда, уровни он проходит все равно чертовски быстро.

    Но оно того стоит.

    вот это прикол

    он просто падает и падает с обрыва много раз. в какой-то момент он таки включает алгоритм с прыжками и что-то перепрыгивает, но в уже следующем раунде опять начинает падать очень много раз. не очень-то похоже на какую-либо учебу. чтобы пройти хотя бы текущий 1-3 с такими "мозгами" нужна недюженная удача. польза этого стрима только разве что в живом общении в чате подписчиков стримера
  • Посмотрел,фейл за фейлом и все.Скучновато,но может будет интересней.
  • Где там нейросеть ? Обычный lua скрипт
  • появлятся, бежит и падает в пропасть через 10 метров. И так раз за разом. Где самообучение? Он даже не пытается изменить ход своих действий. Он вообще ничего не меняет в процессе пробега этих 10 метров.
  • Если это искусственный интеллект, то все весьма печально в этой области 8)
    Иными словами... бред это, а не ИИ. Обучение где? С таким же успехом крыса пройдет уровень, хаотично бегая по комнате, где расставлены сенсоры, что отвечают за действия в игре (стрелки, прыжок и тп)...
    Обучение это когда упал разок в яму и понял, что вот эти отсутствующие кирпичики на земле и есть яма, которую нужно перепрыгивать.
  • A.Soldier of Light
    ну скажем так эму нужно очень много попыток чтобы это понять
    вот к примеру только на 60+ поколении программы, смог пройти левел, а в каждом поколении есть еще "особенности" и геномы
    Спойлер

  • BaLeFullPlayEr24 написал:
    вот к примеру только на 60+ поколении программы, смог пройти левел, а в каждом поколении есть еще "особенности" и геномы

    А как конкретно происходит это обучение то? У животных, например, все просто: дотронулся до огня, стало больно, больше трогать не будет ) Почему у ИИ получается понять смертельность ямы только с черт-знает-какой попытки?
  • A.Soldier of Light
    потому что для ИИ важно дойти до точки выхода, а не с какой попытки он это сделает
    но да в том видео что я скинул программа учится на смертях, в данном стриме что в блоге видимо другой метод входных данных для ИИ и поэтому так долго и муторно он пытается
    вот еще тот же ИИ
    Спойлер
  • Ну он там уже час в яму падает)
  • Эксперимент интересный, но мне кажется, что ребенка и то быстрее обучить.
  • BaLeFullPlayEr24 написал:
    потому что для ИИ важно дойти до точки выхода, а не с какой попытки он это сделает

    Но учится то долго, слишком долго. Вот, в чем вопрос.
    Хорошо, это платформер, вид сбоку, идешь вперед и ничего сложного. А если взять какой-нибудь шутер попроще, скажем, первый Doom, первый уровень. Возможно ли там что-то сделать, чтоб ИИ себя проявил? 8) Да, шутер.
  • Прога ни фига не учится а просто занимается подборкой оптимального маршрута. Она не запоминает удачно сгенереную часть, а просто при очередном фейле отметает его и начинает генерить новый. На счет Дума. Ну мб фигалион раз померев она бы и там подобрала оптимальный алгоритм действий для прохождения.
  • Пока тупит. Но смотреть забавно.
B
i
u
Спойлер