Задача 02A. Feature extraction. DINO
Условие
Требуется выполнить обучение модели для задачи feature extraction с использованием алгоритма DINO (1, 2). Требуется реализовать обучение только для CLS токена.
Требования к датасету
- Необходимо использовать датасет openimages.
- Датасет должен содержать не менее 50k изображений из любого сплита openimages.
Требования к модели
- Модель должна иметь архитектуру transformer.
Требования к реализации
- Модель и обучение должны быть реализованы с использованием библиотеки tensorflow.
- Задачу разрешено выполнять в командах до 3-х человек. Каждый участник получает полные баллы за задачу.
Распределение баллов
Максимальное количество баллов за задачу — 10.
- Данные и аугментация, до + 2.
- Имплементация лоссов, до + 2.
- Имплементация трансформера, до + 2.
- Обучение модели, до + 2.
- Тестирование модели, до + 1
- Бонус, до + 1
Отправка решения
В качестве решения принимается файл с исходным кодом, например jupyter notebook. В систему требуется отправить ссылку на файл, размещённый в открытом доступе (Google Colab, Github, Google Drive и др.), указав среду разработки "Answer text
". После отправки решение необходимо сдать преподавателю лично.
Базовый ноутбук можно скачать здесь.