5. F in a n c ia l R e v ie w
Машинное обучение
N e w T e c h n o lo g y
S u p p o rt Ve c to r B o o s t in g /
VS.
M a t r ix N e t
M a c h in e s ( S V M ) Tr e e n e t
Машинное
обучение
V a p n ik C h e r v o n e n k is S c h a p ir o F r ie d m a n
ICS Moscow ICS Moscow Princeton Stanford
Royal Holloway Yandex
19 9 0 s
Где Все поисковые системы Слишком дорога в 2009
применяется ( Ya n d e x , G o o g le , использовании Яндекс
Ya h o o . . . )
Скорость
работы
Глубина и
точность
5
6. Задача
oДано:
– Обучающая выборка: пользователи с
известным соц-дем профилем.
– Картина поведения обучающей
выборки в интернете.
oОпределить:
– Соц-дем профиль всех
пользователей.
7. Решение задачи
o Обработка данных обучающей выборки с
применением математической модели MatrixNet.
o Алгоритм ищет закономерности:
o Определение факторов, характерных всем
пользователям группы (для каждой соц-дем группы)
o Определение значимости этих факторов
o Экстраполяция результатов на всю совокупность
пользователей Яндекса
Крипта
8. Эффективность
• Вероятность определения пола
пользователя — 74%.
• Возрастные группы определяются в 2 раза
точнее
• Уменьшая охват, увеличиваем точность
определения
8