Задача A. Категории клиентов банка

Входной файл:input.txt   Ограничение времени:1 сек
Выходной файл:output.txt   Ограничение памяти:256 Мб
Максимальный балл:100000  

Условие

Требуется обучить модель определения возрастной категории клиента банка.

Обучающая выборка содержит примерно 18.5 ⋅ 106 записей с транзакциями клиентов. Различных клиентов в обучающей выборке 21~000.

Данные транзакций доступны в файле trans_train.csv. Данные содержат следующие столбцы.

Целевая переменная для обучающего датасета находится в файле target_train.csv. В нем содержится информация о Клиенте и метка возрастной группы, к которой он относится

Тестовая выборка доступна в файле trans_test.csv. Содержит те же столбцы, что и trans_train.csv

Для каждого клиента из тестового набора необходимо предсказать возрастную группу к которой относится клиент. В систему необходимо предоставить для проверки CSV-файл с предсказаниями, он должен содержать две колонки:

Задача представляет из себя мультиклассовую классификацию (4 класса — от 0 до 3). Качество решения считается как доля верно угаданных меток возраста по всем тестовым примерам — accuracy.

Решение набирает количество баллов, вычисляемое по следующей формуле: Score = 105 ⋅ accuracy. accuracy — доля верно классифицированных новостей относительно всех новостей в тестовой выборке.

Формат выходного файла

В систему необходимо предоставить для проверки CSV-файл с предсказаниями, он должен содержать две колонки:


0.035s 0.008s 15