Задача 02B. Reinforcement learning. MAZES

Максимальный балл:10   Ограничение времени:1 сек
  Ограничение памяти:512 Мб

Условие

Требуется обучить модель, решающую лабиринт фиксированного размера, вида и позициями входа и выхода с использованием методов машинного обучения с подкреплением.

Требования к среде

Требования к обучению

Распределение баллов

Максимальное количество баллов за задачу — 10.

Задача допускает дополнительные баллы за выполнение следующих пунктов.

Отправка решения

В качестве решения принимается файл с исходным кодом, например jupyter notebook. В систему требуется отправить ссылку на файл, размещённый в открытом доступе (Google Colab, Github, Google Drive и др.), указав среду разработки "Answer text". После отправки решение необходимо сдать преподавателю лично.


0.266s 0.034s 31