OpenAI построили модель мира, в которой одна команда прячется от другой, т.е. условно физический мир в котором одни боты делают все чтобы их не нашли другие. Боты обучались с подкреплением, запоминая какие их действия с большей вероятностью приводили к победе. И научились довольно неплохо прятаться, используя подручные предметы.
Комментарии: 0
сначала
лучшие
Ваш комментарий