Задача A. Предсказание нагрузки Мегафон

Максимальный балл:10000   Ограничение времени:1 сек
  Ограничение памяти:512 Мб

Условие

При управлении емкостью сети сотовой связи наиболее важным является этап прогноза ключевых показателей сети в среднесрочной перспективе.

Целью задачи является прогнозирование абонентской скорости на заданный временной интервал вперед по каждому сетевому элементу.

Обучающую выборку и исходные данные тестовой выборки можно скачать ЗДЕСЬ.

Вы можете использовать шаблон решения, доступный ЗДЕСЬ.

Формат входных данных

Имеется временной ряд из показателей:

  1. ID - Идентификатор соты int64 (key)
  2. date_ – дата получения статистики datetime (key)
  3. spd – средняя скорость на базовой станции (БС), float32 (в условных единицах по требованиям безопасности)
  4. subs – количество одновременно обслуживаемых абонентов float32 (в условных единицах по требованиям безопасности)
  5. trf – трафик на БС, float32 (в условных единицах по требованиям безопасности)
  6. x – координата Х в метрах, float32 (округлено до 100 метров по требованиям безопасности)
  7. y – координата Y в метрах, float32 (округлено до 100 метров по требованиям безопасности)
  8. azimuth – азимут в градусах, float32
  9. height – высота расположения БС, float32
  10. cap - ёмкость сектора, float32
  11. tech - идентификатор технологии, int32

Метрика качества

Используется взвешенный на Subs показатель среднеквадратичного отклонения (RMSE). Расчет выполняется для всех БС на прогнозируемого периода. Так же учитываются новые БС, которые не присутствовали в тренировочной выборке.

Расчет выполняется как:


def wrmse(spd_predict, spd):
    return (np.sum(((spd_predict - spd) * subs) ** 2) / np.sum(subs**2)) ** 0.5

score = 10000 - int(1000 * wrmse(spd_predict, spd_test))

Формат выходных данных

Для отправки решения нужно:

  1. Создать файл в формате CSV, содержащий столбцы ID,date_,spd. При этом значения в столбцах ID,date_ должны совпадать с данными тестовой выборки, а значения в столбце spd — содержать предсказанные значения скорости.
  2. Загрузить файл на Google Drive, установить режим доступа "По ссылке".
  3. Получить ссылку на файл и отправить её в качестве решения, указав среду разработки Answer text.

Примеры тестов

Стандартный вход Стандартный выход
1
пример нескольких первых строк из файла решения
ID,date_,spd
156,2016-11-02,78.862
156,2016-11-03,18.145

0.267s 0.137s 15