Задача A. Классификация товаров. Farpost

Входной файл:test.json   Ограничение времени:1 сек
Выходной файл:submission.json   Ограничение памяти:512 Мб
Максимальный балл:10000  

Условие

На сайте farpost.ru магазины загружают прайс-листы с перечнем реализуемых товаров, которые автоматически публикуются на сайте. Товары должны оказаться в подходящем разделе, чтобы пользователям сайта было легче их найти. Предлагаем вам построить классификатор для выбора подходящего раздела для товара по его заголовку среди товаров из прайс-листов тематики “Дом и ремонт”.

Вы можете использовать шаблон решения, доступный ЗДЕСЬ.

Критерий оценки

Используется метрика Macro-average F1 score между предсказанным классификатором и ожидаемым результатами на тестовой выборке.

Формат входного файла

Обучающая выборка — файл в формате json lines с заголовками товаров (поле "title") из прайс-листов тематики “Дом и ремонт” и размеченный для каждого товара подходящий раздел (поле "dir").

В тестовой выборке поле "dir" не указано.

Обучающую и тестовую выборки можно скачать ЗДЕСЬ.

Формат выходного файла

Для отправки решения нужно:

  1. Создать в формате json lines, в каждой строке которого содержится ровно один объект с единственным полем "dir", содержащим название раздела для соответствующего товара тестовой выборки. Количество строк должно совпадать с количеством строк тестовой выборки.
  2. Загрузить файл на Google Drive, установить режим доступа "По ссылке".
  3. Получить ссылку на файл и отправить её в качестве решения, указав среду разработки Answer text.


Задача B. Классификация товаров. Farpost: загрузка решения

Максимальный балл:1   Ограничение времени:1 сек
  Ограничение памяти:512 Мб

Условие

В данной задаче необходимо отправить ссылку код для решения задачи классификации, например в виде jupyter notebook. В тексте решения необходимо отметить, какими методами были получены результаты, отправленные в систему, например указав в комментарии перед созданием файла для отправки id попытки, в которую был отправлен этот файл:

# Попытка 654321
submit = pd.DataFrame()
submit['answer'] = my_model.predict(...)
submit.to_json('submission.json')

Формат выходных данных

В выходных данных укажите ссылку на решение (Google Colab, Github, Google Drive и др.).


0.203s 0.015s 17