Эксперимент OpenAI с нейросетями

OpenAI построили модель мира, в которой одна команда прячется от другой, т.е. условно физический мир в котором одни боты делают все чтобы их не нашли другие. Боты обучались с подкреплением, запоминая какие их действия с большей вероятностью приводили к победе. И научились довольно неплохо прятаться, используя подручные предметы.

Комментарии: 0
Ваш комментарий