Задача 03A. Reinforcement learning. Bipedal Walker

Максимальный балл:10   Ограничение времени:1 сек
  Ограничение памяти:512 Мб

Условие

Требуется обучить модель играть в Bipedal Walker.

Требования к среде

Требования к реализации

Распределение баллов

Максимальное количество баллов за задачу — 10.

Отправка решения

В качестве решения принимается файл с исходным кодом, например jupyter notebook. В систему требуется отправить ссылку на файл, размещённый в открытом доступе (Google Colab, Github, Google Drive и др.), указав среду разработки "Answer text". После отправки решение необходимо сдать преподавателю лично.

Базовый ноутбук можно скачать здесь.


0.073s 0.010s 15