Skip to content

vdmitrii/mtscup

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

MTS ML CUP

Первое соревнование от МТС Digital Big Data по определению пола/возраста владельца cookie длительностью два месяца.

Описание

«Я тебя по IP вычислю!» – помните такую угрозу из интернета времен нулевых? Мы в МТС Digital решили выяснить, можно ли составить хотя бы приблизительное представление о человеке, обладая информацией о сайтах, которые он посещает. Для этого мы сгенерировали полусинтетические данные.

Вопрос звучит так: сможем ли мы по таким цифровым следам пользователя (на каких сайтах с каких IP он сидел, сколько раз заходил, какое у него устройство) понять, кто этот пользователь? Студент или пенсионер? Мужчина или женщина?

Действительно, в Digital-рекламе часто сегмент включает себя пол и один из бакетов по возрасту (Класс 1 —19-25, Класс 2 —26-35, Класс 3 —36-45, Класс 4 —46-55, Класс 5 —56-65, Класс 6— 66+). Эта задача особенно актуальна для рекламных DSP-площадок, которые в OpenRTB запросах получают такие данные с частотой 200 000 запросов в секунду со всех сайтов, размещающих рекламу за деньги.

Задача соревнования

Определение пола и возраста владельца HTTP cookie по истории активности пользователя в интернете на основе синтетических данных.

Releases

No releases published

Packages

No packages published

Languages