Входной файл: | test.json | Ограничение времени: | 1 сек | |
Выходной файл: | submission.json | Ограничение памяти: | 512 Мб | |
Максимальный балл: | 10000 |
На сайте farpost.ru магазины загружают прайс-листы с перечнем реализуемых товаров, которые автоматически публикуются на сайте. Товары должны оказаться в подходящем разделе, чтобы пользователям сайта было легче их найти. Предлагаем вам построить классификатор для выбора подходящего раздела для товара по его заголовку среди товаров из прайс-листов тематики “Дом и ремонт”.
Вы можете использовать шаблон решения, доступный ЗДЕСЬ.
Используется метрика Macro-average F1 score между предсказанным классификатором и ожидаемым результатами на тестовой выборке.
Обучающая выборка — файл в формате json lines
с заголовками товаров (поле "title"
) из прайс-листов тематики
“Дом и ремонт” и размеченный для каждого товара подходящий раздел (поле "dir"
).
В тестовой выборке поле "dir"
не указано.
Обучающую и тестовую выборки можно скачать ЗДЕСЬ.
Для отправки решения нужно:
"dir"
,
содержащим название раздела для соответствующего товара тестовой выборки.
Количество строк должно совпадать с количеством строк тестовой выборки.Answer text
.Максимальный балл: | 1 | Ограничение времени: | 1 сек | |
Ограничение памяти: | 512 Мб |
В данной задаче необходимо отправить ссылку код для решения задачи классификации, например в виде jupyter notebook. В тексте решения необходимо отметить, какими методами были получены результаты, отправленные в систему, например указав в комментарии перед созданием файла для отправки id попытки, в которую был отправлен этот файл:
# Попытка 654321
submit = pd.DataFrame()
submit['answer'] = my_model.predict(...)
submit.to_json('submission.json')
В выходных данных укажите ссылку на решение (Google Colab, Github, Google Drive и др.).