Входной файл: | input.txt | Ограничение времени: | 1 сек | |
Выходной файл: | output.txt | Ограничение памяти: | 256 Мб | |
Максимальный балл: | 100000 |
Требуется обучить модель определения категории новости.
Обучающую выборку можно скачать ЗДЕСЬ. Категория новости в обучающей выборке представлена столбцом CAT
.
HEADER
— заголовок новостиMEDIANAME
— название СМИWEBSITE
— вебсайт СМИPTIME
— время публикацииДля определения качества модели будет использоваться тестовая выборка, доступная ЗДЕСЬ.
В тестовой выборке требуется предсказать значения столбца CAT
, соответствующие каждому тестовому примеру. Категории новостей кодируются одним символом, аналогично данным в обучающей выборке.
В качестве решения принимается текстовый файл, содержащий ответ к задаче
в требуемом формате (при его отправке следует выбрать в тестирующей системе среду разработки "Answer text
").
Решение набирает количество баллов, вычисляемое по следующей формуле: Score = 105 ⋅ AccuracyScore. AccuracyScore — доля верно классифицированных новостей относительно всех новостей в тестовой выборке.
Каждая строка выходного файла должна содержать единственный символ, задающий категорию соответствующего тестового примера.