Как использовать внешние данные при найме сотрудников на работу? Какие источники данных могут быть полезны? Как строится аналитическая предиктивная модель для HR скоринга? Опыт реализации проекта от компании CleverDATA
2. Company
Profile
Make
your
data
clever
Оценка
кандидатов
на
вакансию
продавца
с
использованием
внешних
данных
3. cleverdata.ru
|
info@cleverdata.ru
Make
your
data
clever
Развитие
бизнеса
на
международном
рынке
Входит
в
тройку
лидеров
российских
ИТ
компаний
43
подразделения
в
России
и
за
рубежом
Более
7000
сотрудников
100
тыс.проектов
для
10
тыс.заказчиков
MarkeXng
Data
Pla[orm
решение
для
использования
внешних
данных
в
маркетинговых
кампаниях
Разработка
и
внедрение
решений
для
предиктивной
аналитики
и
обработки
больших
объемов
данных
Собственные
центры
разработки
Партнерство
с
мировыми
лидерами
Центр
экспертизы
по
технологиям
Big
Data
и
Digital
MarkeQng
1DMP
4. cleverdata.ru
|
info@cleverdata.ru
Прогноз
успешности
продавца
для
компании
“I
no
longer
look
at
somebody’s
CV
to
determine
if
we
will
interview
them
or
not,”
Teri
Morse,
XEROX
Компания
Xerox
осуществляет
набор
сотрудников
call-‐centres
(штат
55
000
человек
через
предварительный
скоринг-‐тест,
который
предсказывает,
какое
время
человек
проработает
в
компании:
• Люди,
имеющие
1-‐2
аккаунта
в
соц.
сетях
работают
дольше
чем
те,
кто
имеет
3-‐4;
• Факт
работы
на
аналогичной
позиции
не
влияет
на
успех
кандидата.
“I
don’t
know
why
this
works,”
-‐
admits
Ms.
Morse,
-‐“I
just
know
it
works.”
86%
компаний
из
списка
Fortune
1000
собираются
внедрить
эти
подходы
в
ежедневную
в
практику
5. cleverdata.ru
|
info@cleverdata.ru
Прогноз
успешности
продавца
для
компании
Помимо
экстенсивного
развития
для
компаний
становится
актуальным
повышение
точности
действий,
когда
большего
результата
можно
добиться
меньшими
усилиями.
Что,
если
потенциал
кандидата,
как
продавца,
будет
известен
по
каждому
бренду
до
приема
на
работу?
Тогда
компания
начнет
нанимать
больше
хороших
продавцов,
увеличит
выручку,
снизит
нагрузку
на
HR,
уменьшит
«текучку»,
снизит
трудозатраты
на
проведение
собеседований
и
обучение
новых
кадров.
ФИО
RES
LEG
PRE
Иванов
Сергей
Петрович
Сидоров
Иван
Сергеевич
Васильев
Денис
Иванович
Воробьев
Илья
Сергеевич
Денисов
Денис
Денисович
Петров
Сергей
Иванович
Сергеев
Денис
Петрович
6. cleverdata.ru
|
info@cleverdata.ru
Этапы
проекта
Определение
критерия
«плохой»/«хороший»
продавец,
формирование
обучающей
выборки.
Объединение
полученных
внешних
данных
с
внутренними
данными
о
сотрудниках.
Анализ
данных,
поиск
потенциальных
значимых
признаков
Очистка
данных
от
шумов,
построение
модели
на
обучающей
выборке,
тестирование
модели
Проверка
модели
на
тестовой
выборке,
оценка
эффективности.
Хороший
–
плохой
Обогащение
данных
Генерация
признаков
Моделирование
Оценка
эффективности
7. cleverdata.ru
|
info@cleverdata.ru
Этапы
проекта.
Хороший
-‐
плохой
Кто
является
«плохим»
продавцом?
Предложение
CleverDATA:
«плохим»
продавцом
считать
того,
кто
был
уволен
через
3
месяца.
Данный
критерий
позволит
найти:
q сотрудников,
не
справившихся
с
планом;
q сотрудников,
ушедших
самостоятельно;
q уволенных
за
воровство
и
другие
нарушения.
Данный
критерий
не
чувствителен
к:
Сниженные
продажи
Воровство
Нагрузка
на
HR
Затраты
на
обучение
q сезонности;
q периодам
скидок;
q бренду;
q региону;
Результат:
список
сотрудников
с
указанным
критерием
оценки
хорошие
8. cleverdata.ru
|
info@cleverdata.ru
Этапы
проекта.
Обогащение
данных
Результат:
список
сотрудников,
расширенный
новыми
признаками
Социальные
сети
Платежи
СМС-‐рассылки
Дата
первого
СМС
Дата
последнего
СМС
Количество
СМС
за
период
Регион
отправителей
Категория
сообщений:
q
авто
q
финансы
q
недвижимость
q
и
т.п.
ФИО
Контактная
информация
Дата
рождения
Семейное
положение
Языки
Образование
География
Социальный
граф
Интересы
Сумма
платежей
за
период
Количество
платежей
Сумма
макс.
платежа
Средняя
сумма
платежа
Дата
последнего
платежа
Провайдер
Регион
последнего
платежа
Доминирующий
регион
9. cleverdata.ru
|
info@cleverdata.ru
Этапы
проекта.
Генерация
признаков
Из
всего
массива
информации
о
сотрудниках
производится
генерация
новых
признаков,
которые
потенциально
могут
быть
предикторами
для
модели
оценки
успешности
кандидата.
Например:
• из
списка
предыдущих
работодателей
можно
получить
сферу
деятельности,
размеры
компаний;
• из
социального
графа
–
количество
друзей,
показатель
активности;
• из
списка
посещенных
страниц
–
интересы.
Всего
может
быть
создано
более
100
новых
признаков.
Результат:
список
признаков
для
начала
обучения
модели
10. cleverdata.ru
|
info@cleverdata.ru
Этапы
проекта.
Моделирование
Обучение
(6
тыс.
сотрудников)
Поиск
корреляций
между
признаками
сотрудников
и
известной
оценкой
кандидата
«плохой»
/
«хороший»
по
имеющейся
базе
сотрудников.
Выявление
и
устранение
взаимных
корреляций
между
признаками.
Результат:
обученная
модель,
список
значимых
предикторов
t
Поиск
значимых
признаков
Адаптация
модели
Тестовая
эксплуатация
модели
на
реальных
данных.
Корректировка
коэффициентов.
Предикторы
Все
признаки
прошлое
будущее
11. cleverdata.ru
|
info@cleverdata.ru
Этапы
проекта.
Оценка
эффективности
Результат:
решение
об
эффективности
модели
База
сотрудников
Найденные
плохие
N
X
Y
Проверка
успешности
выявления
«плохих»
продавцов.
Критерий
эффективности
модели:
точность
модели
должна
быть
минимум
70%
В
случае
достижения
критерия
-‐
оплата
этапа
«Пилотный
проект»
и
переход
к
этапу
«Разработка
системы».
Если
критерии
не
достигнуты,
остановка
проекта
без
оплаты.
12. cleverdata.ru
|
info@cleverdata.ru
Как
будет
работать
модель
1) Кандидат
заполняет
анкету
на
сайте;
2) Данные
сохраняются
в
хранилище;
3) Отправляется
запрос
на
внешние
данные;
4) Внешние
данные
сохраняются
в
хранилище;
5) Значимые
поля
передаются
в
модель;
6) Модель
на
основе
полученных
данных
строит
прогноз
успешности
продавца;
7) Сотрудник
HR
видит
список
кандидатов,
их
анкеты
и
прогноз
успешности
от
модели
и
принимает
решение
о
приглашении
кандидата
на
собеседование.
Веб-‐сайт
IRG
Хранилище
DMP
Модель
IRG
1
2
3
4
5
6
13. cleverdata.ru
|
info@cleverdata.ru
Исходные
данные
3200
сотрудников
54%
«хороших»
46%
«плохих»
Для
анализа
были
взяты
кассиры-‐продавцы
Заказчик
определил
критерий
«хороший»
/
«плохой»
по
каждому
сотруднику
Если
сотрудник
продает
больше
среднего,
то
он
«хороший».
Если
меньше
–
«плохой».
14. cleverdata.ru
|
info@cleverdata.ru
Постановка
задачи
Спрогнозировать,
насколько
успешным
продавцом
будет
кандидат,
основываясь
только
на
той
информации,
которую
он
оставил
в
анкете
на
вакансию
???
16. cleverdata.ru
|
info@cleverdata.ru
Обогащение
данных
По
сотрудникам
были
получены
различные
внешние
данные
из
социальных
сетей,
агрегаторов
СМС-‐рассылок,
платежных
систем.
Источник
данных
Идентификатор
для
поиска
Найдено
сотрудников
Социальные
сети
ФИО,
дата
рождения,
город
60%
СМС-‐рассылки
Номер
телефона
94%
Платежные
системы
Номер
телефона
93%
Телефоны
предоставлены
по
75%
сотрудников
17. cleverdata.ru
|
info@cleverdata.ru
Прогнозирование
успешности
продавца
На
основе
информации
о
сотруднике
из
внешних
источников
методами
машинного
обучения
были
найдены
зависимости
между
характеристиками
человека
и
его
успешностью,
как
продавца.
18. cleverdata.ru
|
info@cleverdata.ru
Определение
уровня
риска
Было
создано
5
математических
моделей
по
сегментированию
сотрудников
Модель
определяет
уровень
риска
для
компании
при
найме
кандидата
Высокий
риск
Средний
риск
Низкий
риск
19. cleverdata.ru
|
info@cleverdata.ru
RISK
Shop
1
Shop
2
Shop
3
Shop
4
LOW
17%
19%
17%
24%
MED
54%
58%
56%
59%
HIGH
29%
22%
27%
17%
Распределение
сотрудников
по
зонам
риска
Результаты
Big
Data-‐оценки
предоставленного
списка
сотрудников:
20. cleverdata.ru
|
info@cleverdata.ru
Какие
помогли
внешние
данные?
Внешние
данные,
определяющие
оценку
«хороший»
/
«плохой»:
• Оператор
связи;
• Общая
сумма
платежей
за
телефон
• Частый
отправитель
СМС
• Количество
друзей;
• Количество
альбомов;
• Доля
постов,
состоящих
из
фотографий;
• Количество
подписчиков
и
т.д.
Платежные
системы
СМС
Социальные
сети
22. cleverdata.ru
|
info@cleverdata.ru
Как
применять
модель
Что
было
бы,
если
кандидатов
принимали
на
работу
по
данной
системе?
MEDIUM
RISK
HIGH
RISK
LOW
RISK
ОТКАЗ
СТАНДАРТНАЯ
МЕТОДИКА
ПРИЕМА
ПРИЕМ
23. cleverdata.ru
|
info@cleverdata.ru
Оценка
эффективности
В
среднем
ежемесячно
принимается
170
сотрудников
Стандартный
прием
Big
Data
90
хороших
80
плохих
107
хороших
63
плохих
Средняя
разница
в
валовой
прибыли
«плохого»
и
«хорошего»
продавца
составляет
360
тыс.
рублей
в
месяц.
Увеличение
прибыли
составит
6
100
000
рублей
в
месяц
без
учета
нарастающего
итога