SlideShare uma empresa Scribd logo
1 de 21
Baixar para ler offline
Сегментация	
  пользователей	
  
	
  	
  в	
  online-­‐рекламе	
  
Apache	
  Spark:	
  
Сергей	
  Жемжицкий,	
  CTO,	
  CleverDATA	
  
для	
  практического	
  семинара	
  
«Hadoop	
  на	
  практике:	
  проекты	
  и	
  инструменты»	
  
22	
  апреля,	
  2015	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Interna'onal	
  market	
  
business	
  development	
  	
  
since	
  2012	
  	
  
One	
  of	
  three	
  leading	
  IT	
  companies	
  in	
  Russia	
  
43	
  branches	
  in	
  Russia	
  and	
  abroad	
  
+5500	
  employees	
  
100K	
  projects	
  for	
  10K	
  customers	
  
Data	
  management	
  innova've	
  
pladorm	
  (Data	
  Exchange	
  Service)	
  
Cloud	
  Service	
  
In-­‐house	
  development	
  
Internet	
  advergsing	
  solu'ons	
  
Data	
  Management	
  PlaDorms	
  
Customers	
  Base	
  Management	
  	
  
Web	
  Analygcs	
  
Markegng	
  automa'on	
  
Big	
  Data	
  
	
  	
  	
  	
  Data	
  Mining	
  
	
  	
  	
  	
  	
  	
  	
  	
  Digital	
  Intelligence	
  
	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  Operagonal	
  Intelligence	
  
	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  Low	
  Latency	
  and	
  NoSQL	
  
	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  	
  Cloud	
  Compugng	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Агенда	
  
•  Введение	
  в	
  RTB;	
  
•  Потоки	
  данных;	
  
•  Типы	
  данных;	
  
•  Монетизация	
  данных;	
  
•  Hadoop	
  vs.	
  Spark;	
  
•  Что	
  дальше.	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
publishers	
  
AD	
  NETWORK	
  
AD	
  NETWORK	
  
AD	
  NETWORK	
  
AD	
  NETWORK	
  
AD	
  NETWORK	
  
AD	
  NETWORK	
  
advergsers	
  
D
S	
  
P	
  
S
S	
  
P	
  
Real	
  Time	
  Bidding	
  (RTB)	
  
TRACKING	
  DATA	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
publishers	
  
COOKIE	
  SYNCs	
  
ACCESS	
  LOGS	
  
PARTNER’S	
  DATA	
  
3rd	
  PARTY	
  DATA	
  
CLICK	
  STREAMS	
  
advergsers	
  
S
S	
  
P	
  
D
S	
  
P	
  
DMP	
  
Data	
  Management	
  Pladorm	
  (DMP)	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
3rd	
  party	
  
data	
  
Relagonal	
  Data	
  Store	
  
raw	
  data	
  3rd	
  party	
  
data	
  
3rd	
  party	
  
data	
  
Raw	
  Data	
  Store	
  &	
  Processing	
  
RealTime	
  Data	
  Store	
  
user	
  profiles	
  aggregates	
  
Типовые	
  потоки	
  данных	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Типовые	
  потоки	
  данных	
  ::	
  RTB	
  
3rd	
  party	
  
data	
  
Relagonal	
  Data	
  Store	
  
RTB	
  
SRV	
  
Exchange	
  
SSP	
  
bid	
  req.	
  
bid	
  resp.	
  
pixels	
  ::	
  impressions	
  ::	
  clicks	
  
bid	
  requests	
  
user	
  profiles	
  
raw	
  data	
  3rd	
  party	
  
data	
  
3rd	
  party	
  
data	
  
Raw	
  Data	
  Store	
  &	
  Processing	
  
RealTime	
  Data	
  Store	
  
user	
  profiles	
  aggregates	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
1st-­‐party	
  data	
  
3rd	
  party	
  
data	
  
Relagonal	
  Data	
  Store	
  
RTB	
  
SRV	
  
Exchange	
  
SSP	
  
bid	
  req.	
  
bid	
  resp.	
  
pixels	
  ::	
  impressions	
  ::	
  clicks	
  
bid	
  requests	
  
user	
  profiles	
  
raw	
  data	
  3rd	
  party	
  
data	
  
3rd	
  party	
  
data	
  
Raw	
  Data	
  Store	
  &	
  Processing	
  
RealTime	
  Data	
  Store	
  
user	
  profiles	
  aggregates	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
1st-­‐party	
  data	
  
•  Зачем	
  монетизировать?	
  
•  Как	
  монетизировать?	
  
	
  
•  Чем	
  монетизировать?	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Зачем	
  монетизировать?	
  
Найти	
  всех	
  пользователей,	
  которые	
  
участвовали	
  в	
  рекламной	
  кампании	
  “Star	
  Wars”	
  [и]	
  
видели	
  один	
  из	
  баннеров	
  “Darth	
  Vader”	
  или	
  “Luke	
  Skywalker”	
  	
  
в	
  течении	
  последних	
  6	
  дней	
  [и]	
  
кликнули	
  на	
  этот	
  баннер	
  [и]	
  
посетили	
  страницу	
  покупки	
  светового	
  меча	
  Darth’а	
  Vader’а	
  [и]	
  
но	
  так	
  ничего	
  и	
  не	
  купили	
  
Для	
  того,	
  чтобы	
  
сделать	
  ретаргетинг	
  персонифицированным	
  баннером	
  со	
  
скидкой	
  на	
  меч	
  в	
  40%	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
find	
  all	
  users	
  who	
  have	
  
taken	
  part	
  in	
  campaign[s]	
  “Star	
  Wars”	
  [and]	
  
viewed	
  banner[s]	
  “Darth	
  Vader”	
  or	
  “Luke	
  Skywalker”	
  
during	
  [last]	
  6	
  day[s]	
  [and]	
  
clicked	
  banner[s]	
  “Darth	
  Vader's	
  lightsaber”	
  [and]	
  
visited	
  buying	
  area	
  of	
  “Darth	
  Vader's	
  lightsaber”	
  [and]	
  
not	
  visited	
  order	
  confirmed	
  area	
  of	
  “Darth	
  Vader's	
  lightsaber”	
  
Как	
  монетизировать?	
  
[impression]	
  
[click]	
  
[tr.	
  pixel]	
  
[tr.	
  pixel]	
  
id	
   cookie	
   event_id	
   event_type	
   campaign_id	
   gmestamp	
   …	
  
1	
   c1	
   “Darth	
  Vader”	
  	
   impression	
   “Star	
  Wars”	
  	
   2015-­‐04-­‐20	
  14:25:11.462	
   …	
  
2	
   c1	
   “Darth	
  Vader's	
  lightsaber”	
   click	
   “Star	
  Wars”	
  	
   2015-­‐04-­‐21	
  06:31:12.157	
   …	
  
3	
   c1	
   “Darth	
  Vader's	
  lightsaber”	
  	
   tr.	
  pixel	
   “Star	
  Wars”	
  	
   2015-­‐04-­‐22	
  18:57:19.628	
   …	
  
[cookies]	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Как	
  монетизировать?	
  
reduce	
  find	
  all	
  users	
  who	
  have	
  
taken	
  part	
  in	
  campaign[s]	
  “Star	
  Wars”	
  
	
  	
  
viewed	
  banner[s]	
  “Darth	
  Vader”	
  or	
  
“Luke	
  Skywalker”	
  during	
  [last]	
  6	
  day[s]	
  
	
  
clicked	
  banner[s]	
  “Darth	
  Vader's	
  
lightsaber”	
  
	
  
visited	
  buying	
  area	
  of	
  “Darth	
  Vader's	
  
lightsaber”	
  
	
  
not	
  visited	
  order	
  confirmed	
  area	
  of	
  “Darth	
  
Vader's	
  lightsaber”	
  
(c1,	
  0)	
  
(c1,	
  1)	
  
(c1,	
  2)	
  
(c1,	
  3)	
  
Ø	
  
map	
  
(c1,	
  0;1;2;3)	
  
	
  	
  
true(0)	
  and	
  
true(1)	
  and	
  
true(2)	
  and	
  
true(3)	
  and	
  	
  	
  	
  	
  	
  	
  	
  
not	
  false(4)	
  
C1	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Чем	
  монетизировать?	
  
VS.	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Spark	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Перед	
  тем,	
  как	
  смотреть	
  на	
  Hadoop	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Hadoop	
  Map-­‐Reduce	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Hadoop	
  и	
  Spark:	
  Side	
  by	
  Side	
  ::	
  Hadoop	
  
Инициализация	
  	
  
ü  protected	
  void	
  setup(Map.Context	
  context)	
  
ü  protected	
  void	
  setup(Reduce.Context	
  context)	
  
ü  protected	
  void	
  setup(XXX.Context	
  context)	
  
ü  org.apache.hadoop.conf.Configured	
  
ü  distributed	
  cache	
  
	
  
Параллелизм	
  	
  
ü  mapred.reduce.tasks	
  
ü  mapreduce.job.reduces	
  
ü  spli›able	
  formats	
  
	
  
Зависимости	
  
	
  
ü  org.apache.hadoop.ugl.Tool	
  	
  
ü  org.apache.hadoop.ugl.ToolRunner	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Hadoop	
  и	
  Spark	
  ::	
  Side	
  by	
  Side	
  ::	
  Spark	
  
Инициализация	
  	
  
ü  mapRegion	
  
ü  broadcast	
  vars	
  
	
  
Параллелизм	
  	
  
ü  spark.default.parallelism	
  
ü  num-­‐executors	
  и	
  executor-­‐cores	
  в	
  yarn	
  
ü  numTasks	
  в	
  groupByKey,	
  reduceByKey,	
  aggregateByKey…	
  
	
  
Зависимости	
  	
  
-­‐-­‐jars	
  hadoop-­‐ugls.jar,ad-­‐segmenter.jar	
  
-­‐-­‐files	
  app.conf	
  	
  
-­‐-­‐driver-­‐java-­‐opgons=-­‐Dconfig.resource=app.conf	
  
-­‐-­‐conf	
  config.resource=app.conf	
  
-­‐-­‐conf	
  spark.driver.extraJavaOpgons=-­‐Dconfig.resource=app.conf	
  	
  	
  	
  
-­‐-­‐conf	
  spark.executor.extraJavaOpgons=-­‐Dconfig.resource=app.conf	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Что	
  дальше	
  и	
  почему	
  Spark?	
  
•  Spark	
  Streaming;	
  
•  Micro	
  Batches;	
  
•  λ-­‐архитектура.	
  
	
  
	
  
	
  
	
  
	
  
	
  
без	
  серьезного	
  хирургического	
  вмешательства	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Спасибо	
  за	
  вопросы!	
  
info@cleverleaf.co.uk	
  	
   ::	
   info@cleverdata.ru	
  
cleverleaf.co.uk	
   ::	
   cleverdata.ru	
  
1dmp.io	
   ::	
   crawler.1dmp.io	
  
facebook.com/CleverData	
  	
   ::	
   +7	
  (495)	
  967-­‐66-­‐50	
  	
  

Mais conteúdo relacionado

Mais procurados

Тренды сегодня: Big Data
Тренды сегодня: Big DataТренды сегодня: Big Data
Тренды сегодня: Big DataAndrey Kazakevich
 
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA
 
Большие данные в маркетинге: обработка, хранение, монетизация (Big Data 2017)
Большие данные в маркетинге: обработка, хранение, монетизация (Big Data 2017)Большие данные в маркетинге: обработка, хранение, монетизация (Big Data 2017)
Большие данные в маркетинге: обработка, хранение, монетизация (Big Data 2017)CleverDATA
 
Customers segmentation_responce prediction
Customers segmentation_responce predictionCustomers segmentation_responce prediction
Customers segmentation_responce predictionCleverDATA
 
Больше DMP, хороших и разных
Больше DMP, хороших и разныхБольше DMP, хороших и разных
Больше DMP, хороших и разныхHybridRussia
 
Д.Афанасьев_ CleverDATA_Охота за данными
Д.Афанасьев_ CleverDATA_Охота за даннымиД.Афанасьев_ CleverDATA_Охота за данными
Д.Афанасьев_ CleverDATA_Охота за даннымиCleverDATA
 
HR_Scoring_CleverDATA
HR_Scoring_CleverDATAHR_Scoring_CleverDATA
HR_Scoring_CleverDATACleverDATA
 
Будущее медиа в эпоху больших данных: ничего личного
Будущее медиа в эпоху больших данных: ничего личногоБудущее медиа в эпоху больших данных: ничего личного
Будущее медиа в эпоху больших данных: ничего личногоData-Centric_Alliance
 
Oracle big data for finance
Oracle big data for financeOracle big data for finance
Oracle big data for financeCleverDATA
 
Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?Den Reymer
 
Big Data: Как принести пользу Бизнесу
Big Data: Как принести пользу БизнесуBig Data: Как принести пользу Бизнесу
Big Data: Как принести пользу БизнесуDen Reymer
 
Rtb-media.ru b2b presentation
Rtb-media.ru b2b presentationRtb-media.ru b2b presentation
Rtb-media.ru b2b presentationRTB-media RU
 
CleverDATA_1DMP.RU_ for_enterprise
CleverDATA_1DMP.RU_ for_enterpriseCleverDATA_1DMP.RU_ for_enterprise
CleverDATA_1DMP.RU_ for_enterpriseCleverDATA
 
Fors и big data appliance
Fors и big data applianceFors и big data appliance
Fors и big data applianceCleverDATA
 
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьBig Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьTechart Marketing Group
 
Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015rusbase
 
Big data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризисаBig data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризисаГлеб Кащеев
 

Mais procurados (20)

Тренды сегодня: Big Data
Тренды сегодня: Big DataТренды сегодня: Big Data
Тренды сегодня: Big Data
 
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)
 
Большие данные в маркетинге: обработка, хранение, монетизация (Big Data 2017)
Большие данные в маркетинге: обработка, хранение, монетизация (Big Data 2017)Большие данные в маркетинге: обработка, хранение, монетизация (Big Data 2017)
Большие данные в маркетинге: обработка, хранение, монетизация (Big Data 2017)
 
Customers segmentation_responce prediction
Customers segmentation_responce predictionCustomers segmentation_responce prediction
Customers segmentation_responce prediction
 
Больше DMP, хороших и разных
Больше DMP, хороших и разныхБольше DMP, хороших и разных
Больше DMP, хороших и разных
 
Д.Афанасьев_ CleverDATA_Охота за данными
Д.Афанасьев_ CleverDATA_Охота за даннымиД.Афанасьев_ CleverDATA_Охота за данными
Д.Афанасьев_ CleverDATA_Охота за данными
 
HR_Scoring_CleverDATA
HR_Scoring_CleverDATAHR_Scoring_CleverDATA
HR_Scoring_CleverDATA
 
FACETz for business
FACETz for businessFACETz for business
FACETz for business
 
DataLift.DA
DataLift.DADataLift.DA
DataLift.DA
 
Будущее медиа в эпоху больших данных: ничего личного
Будущее медиа в эпоху больших данных: ничего личногоБудущее медиа в эпоху больших данных: ничего личного
Будущее медиа в эпоху больших данных: ничего личного
 
Oracle big data for finance
Oracle big data for financeOracle big data for finance
Oracle big data for finance
 
11 saginov
11 saginov11 saginov
11 saginov
 
Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?Big Data: О чем думают ваши клиенты?
Big Data: О чем думают ваши клиенты?
 
Big Data: Как принести пользу Бизнесу
Big Data: Как принести пользу БизнесуBig Data: Как принести пользу Бизнесу
Big Data: Как принести пользу Бизнесу
 
Rtb-media.ru b2b presentation
Rtb-media.ru b2b presentationRtb-media.ru b2b presentation
Rtb-media.ru b2b presentation
 
CleverDATA_1DMP.RU_ for_enterprise
CleverDATA_1DMP.RU_ for_enterpriseCleverDATA_1DMP.RU_ for_enterprise
CleverDATA_1DMP.RU_ for_enterprise
 
Fors и big data appliance
Fors и big data applianceFors и big data appliance
Fors и big data appliance
 
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьBig Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
 
Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015
 
Big data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризисаBig data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризиса
 

Semelhante a CleverDATA_Spark_audience_segmentation_in_online_ad

Аналитика над петабайтами в реальном времени
Аналитика над петабайтами в реальном времениАналитика над петабайтами в реальном времени
Аналитика над петабайтами в реальном времениCodeFest
 
Аналитика над петабайтами в реальном времени
Аналитика над петабайтами в реальном времениАналитика над петабайтами в реальном времени
Аналитика над петабайтами в реальном времениAlexander Demidko
 
Анализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft biАнализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft biМаксим Войцеховский
 
Перезентация с доклада на конференции MarketingOne2014
Перезентация с доклада на конференции MarketingOne2014Перезентация с доклада на конференции MarketingOne2014
Перезентация с доклада на конференции MarketingOne2014RTB-media RU
 
2 sap v1_do_как big_data меняет бизнес
2 sap v1_do_как big_data меняет бизнес2 sap v1_do_как big_data меняет бизнес
2 sap v1_do_как big_data меняет бизнесantishmanti
 
SOLD OUT легко: RTB и таргетинг
SOLD OUT легко: RTB и таргетингSOLD OUT легко: RTB и таргетинг
SOLD OUT легко: RTB и таргетингMolinos
 
Конференция Юкон. Процессинг данных на лямбда архитектуре.
Конференция Юкон. Процессинг данных на лямбда архитектуре.Конференция Юкон. Процессинг данных на лямбда архитектуре.
Конференция Юкон. Процессинг данных на лямбда архитектуре.Anatoliy Nikulin
 
презентация Clever data конференция splunk октябрь 2016 v2
презентация Clever data конференция splunk октябрь 2016 v2презентация Clever data конференция splunk октябрь 2016 v2
презентация Clever data конференция splunk октябрь 2016 v2Timur Bagirov
 
Splunk - универсальная платформа для работы с любыми данными
Splunk - универсальная платформа для работы с любыми даннымиSplunk - универсальная платформа для работы с любыми данными
Splunk - универсальная платформа для работы с любыми даннымиCleverDATA
 
Дмитрий Лелис, Каванга: "Программные закупки и предиктивные технологии в меди...
Дмитрий Лелис, Каванга: "Программные закупки и предиктивные технологии в меди...Дмитрий Лелис, Каванга: "Программные закупки и предиктивные технологии в меди...
Дмитрий Лелис, Каванга: "Программные закупки и предиктивные технологии в меди...web2win
 
Cpa ex узкийкруг_cpa_06042017
Cpa ex узкийкруг_cpa_06042017Cpa ex узкийкруг_cpa_06042017
Cpa ex узкийкруг_cpa_06042017CPAex
 
В Рунете научились монетизировать зарубежный трафик
В Рунете научились монетизировать зарубежный трафикВ Рунете научились монетизировать зарубежный трафик
В Рунете научились монетизировать зарубежный трафикMaksim Krasovskiy
 
Project presentation
Project presentationProject presentation
Project presentationRoman Rezaev
 
Den Reymer Resilience_2014
Den Reymer Resilience_2014Den Reymer Resilience_2014
Den Reymer Resilience_2014CleverDATA
 
Облачные тренды 2015-16
Облачные тренды 2015-16Облачные тренды 2015-16
Облачные тренды 2015-16Michael Kozloff
 

Semelhante a CleverDATA_Spark_audience_segmentation_in_online_ad (20)

Аналитика над петабайтами в реальном времени
Аналитика над петабайтами в реальном времениАналитика над петабайтами в реальном времени
Аналитика над петабайтами в реальном времени
 
Аналитика над петабайтами в реальном времени
Аналитика над петабайтами в реальном времениАналитика над петабайтами в реальном времени
Аналитика над петабайтами в реальном времени
 
Prezent кмр
Prezent кмрPrezent кмр
Prezent кмр
 
Netpeak Talks #8 Запуск и ведение PPC проектов в СНГ и на Западе.
Netpeak Talks #8 Запуск и ведение PPC проектов в СНГ и на Западе.Netpeak Talks #8 Запуск и ведение PPC проектов в СНГ и на Западе.
Netpeak Talks #8 Запуск и ведение PPC проектов в СНГ и на Западе.
 
Анализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft biАнализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft bi
 
Перезентация с доклада на конференции MarketingOne2014
Перезентация с доклада на конференции MarketingOne2014Перезентация с доклада на конференции MarketingOne2014
Перезентация с доклада на конференции MarketingOne2014
 
2 sap v1_do_как big_data меняет бизнес
2 sap v1_do_как big_data меняет бизнес2 sap v1_do_как big_data меняет бизнес
2 sap v1_do_как big_data меняет бизнес
 
TM Forum and Big Data
TM Forum and Big DataTM Forum and Big Data
TM Forum and Big Data
 
SOLD OUT легко: RTB и таргетинг
SOLD OUT легко: RTB и таргетингSOLD OUT легко: RTB и таргетинг
SOLD OUT легко: RTB и таргетинг
 
Конференция Юкон. Процессинг данных на лямбда архитектуре.
Конференция Юкон. Процессинг данных на лямбда архитектуре.Конференция Юкон. Процессинг данных на лямбда архитектуре.
Конференция Юкон. Процессинг данных на лямбда архитектуре.
 
презентация Clever data конференция splunk октябрь 2016 v2
презентация Clever data конференция splunk октябрь 2016 v2презентация Clever data конференция splunk октябрь 2016 v2
презентация Clever data конференция splunk октябрь 2016 v2
 
Splunk - универсальная платформа для работы с любыми данными
Splunk - универсальная платформа для работы с любыми даннымиSplunk - универсальная платформа для работы с любыми данными
Splunk - универсальная платформа для работы с любыми данными
 
Дмитрий Лелис, Каванга: "Программные закупки и предиктивные технологии в меди...
Дмитрий Лелис, Каванга: "Программные закупки и предиктивные технологии в меди...Дмитрий Лелис, Каванга: "Программные закупки и предиктивные технологии в меди...
Дмитрий Лелис, Каванга: "Программные закупки и предиктивные технологии в меди...
 
Start upshow 3dinn
Start upshow 3dinnStart upshow 3dinn
Start upshow 3dinn
 
Cpa ex узкийкруг_cpa_06042017
Cpa ex узкийкруг_cpa_06042017Cpa ex узкийкруг_cpa_06042017
Cpa ex узкийкруг_cpa_06042017
 
В Рунете научились монетизировать зарубежный трафик
В Рунете научились монетизировать зарубежный трафикВ Рунете научились монетизировать зарубежный трафик
В Рунете научились монетизировать зарубежный трафик
 
Project presentation
Project presentationProject presentation
Project presentation
 
Den Reymer Resilience_2014
Den Reymer Resilience_2014Den Reymer Resilience_2014
Den Reymer Resilience_2014
 
Intens
IntensIntens
Intens
 
Облачные тренды 2015-16
Облачные тренды 2015-16Облачные тренды 2015-16
Облачные тренды 2015-16
 

Mais de CleverDATA

CRM onboarding - оффлайн данные для онлайн рекламы
CRM onboarding - оффлайн данные для онлайн рекламы CRM onboarding - оффлайн данные для онлайн рекламы
CRM onboarding - оффлайн данные для онлайн рекламы CleverDATA
 
Jpoint 2017 - как это было (обзор конференции)
Jpoint 2017 - как это было (обзор конференции)Jpoint 2017 - как это было (обзор конференции)
Jpoint 2017 - как это было (обзор конференции)CleverDATA
 
Data exchange как ключевой элемент экосистемы обмена данными
Data exchange как ключевой элемент экосистемы обмена даннымиData exchange как ключевой элемент экосистемы обмена данными
Data exchange как ключевой элемент экосистемы обмена даннымиCleverDATA
 
Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...
Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...
Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...CleverDATA
 
Splunk for IT Operations and IT Service Intelligence
Splunk for IT Operations and IT Service IntelligenceSplunk for IT Operations and IT Service Intelligence
Splunk for IT Operations and IT Service IntelligenceCleverDATA
 
CleverDATA_Afanasev_DigitalEconomy
CleverDATA_Afanasev_DigitalEconomyCleverDATA_Afanasev_DigitalEconomy
CleverDATA_Afanasev_DigitalEconomyCleverDATA
 
CleverDATA for Hadoop_Meetup_22052015_Spark_vs_Hadoop
CleverDATA for Hadoop_Meetup_22052015_Spark_vs_HadoopCleverDATA for Hadoop_Meetup_22052015_Spark_vs_Hadoop
CleverDATA for Hadoop_Meetup_22052015_Spark_vs_HadoopCleverDATA
 
Julia Tuzin teradata omnichannel_interactions
Julia Tuzin teradata omnichannel_interactionsJulia Tuzin teradata omnichannel_interactions
Julia Tuzin teradata omnichannel_interactionsCleverDATA
 
Karel jabornik teradata real-time-interaction_mngmt
Karel jabornik teradata real-time-interaction_mngmtKarel jabornik teradata real-time-interaction_mngmt
Karel jabornik teradata real-time-interaction_mngmtCleverDATA
 
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015CleverDATA
 
CleverCLUB-26.03.15-K.Obukhov
CleverCLUB-26.03.15-K.ObukhovCleverCLUB-26.03.15-K.Obukhov
CleverCLUB-26.03.15-K.ObukhovCleverDATA
 
CleverCLUB-26.03.15-G.Kanevsky
CleverCLUB-26.03.15-G.KanevskyCleverCLUB-26.03.15-G.Kanevsky
CleverCLUB-26.03.15-G.KanevskyCleverDATA
 
Predictive models for Operational analytics
Predictive models for Operational analyticsPredictive models for Operational analytics
Predictive models for Operational analyticsCleverDATA
 
Digital Marketing Analytics on Splunk platform
Digital Marketing Analytics on Splunk platformDigital Marketing Analytics on Splunk platform
Digital Marketing Analytics on Splunk platformCleverDATA
 
10 Critical Mistakes in Data Analysis
10 Critical Mistakes in Data Analysis 10 Critical Mistakes in Data Analysis
10 Critical Mistakes in Data Analysis CleverDATA
 
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...CleverDATA
 

Mais de CleverDATA (16)

CRM onboarding - оффлайн данные для онлайн рекламы
CRM onboarding - оффлайн данные для онлайн рекламы CRM onboarding - оффлайн данные для онлайн рекламы
CRM onboarding - оффлайн данные для онлайн рекламы
 
Jpoint 2017 - как это было (обзор конференции)
Jpoint 2017 - как это было (обзор конференции)Jpoint 2017 - как это было (обзор конференции)
Jpoint 2017 - как это было (обзор конференции)
 
Data exchange как ключевой элемент экосистемы обмена данными
Data exchange как ключевой элемент экосистемы обмена даннымиData exchange как ключевой элемент экосистемы обмена данными
Data exchange как ключевой элемент экосистемы обмена данными
 
Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...
Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...
Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...
 
Splunk for IT Operations and IT Service Intelligence
Splunk for IT Operations and IT Service IntelligenceSplunk for IT Operations and IT Service Intelligence
Splunk for IT Operations and IT Service Intelligence
 
CleverDATA_Afanasev_DigitalEconomy
CleverDATA_Afanasev_DigitalEconomyCleverDATA_Afanasev_DigitalEconomy
CleverDATA_Afanasev_DigitalEconomy
 
CleverDATA for Hadoop_Meetup_22052015_Spark_vs_Hadoop
CleverDATA for Hadoop_Meetup_22052015_Spark_vs_HadoopCleverDATA for Hadoop_Meetup_22052015_Spark_vs_Hadoop
CleverDATA for Hadoop_Meetup_22052015_Spark_vs_Hadoop
 
Julia Tuzin teradata omnichannel_interactions
Julia Tuzin teradata omnichannel_interactionsJulia Tuzin teradata omnichannel_interactions
Julia Tuzin teradata omnichannel_interactions
 
Karel jabornik teradata real-time-interaction_mngmt
Karel jabornik teradata real-time-interaction_mngmtKarel jabornik teradata real-time-interaction_mngmt
Karel jabornik teradata real-time-interaction_mngmt
 
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
 
CleverCLUB-26.03.15-K.Obukhov
CleverCLUB-26.03.15-K.ObukhovCleverCLUB-26.03.15-K.Obukhov
CleverCLUB-26.03.15-K.Obukhov
 
CleverCLUB-26.03.15-G.Kanevsky
CleverCLUB-26.03.15-G.KanevskyCleverCLUB-26.03.15-G.Kanevsky
CleverCLUB-26.03.15-G.Kanevsky
 
Predictive models for Operational analytics
Predictive models for Operational analyticsPredictive models for Operational analytics
Predictive models for Operational analytics
 
Digital Marketing Analytics on Splunk platform
Digital Marketing Analytics on Splunk platformDigital Marketing Analytics on Splunk platform
Digital Marketing Analytics on Splunk platform
 
10 Critical Mistakes in Data Analysis
10 Critical Mistakes in Data Analysis 10 Critical Mistakes in Data Analysis
10 Critical Mistakes in Data Analysis
 
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
 

CleverDATA_Spark_audience_segmentation_in_online_ad

  • 1. Сегментация  пользователей      в  online-­‐рекламе   Apache  Spark:   Сергей  Жемжицкий,  CTO,  CleverDATA   для  практического  семинара   «Hadoop  на  практике:  проекты  и  инструменты»   22  апреля,  2015  
  • 2. cleverdata.ru    |    info@cleverdata.ru   Interna'onal  market   business  development     since  2012     One  of  three  leading  IT  companies  in  Russia   43  branches  in  Russia  and  abroad   +5500  employees   100K  projects  for  10K  customers   Data  management  innova've   pladorm  (Data  Exchange  Service)   Cloud  Service   In-­‐house  development   Internet  advergsing  solu'ons   Data  Management  PlaDorms   Customers  Base  Management     Web  Analygcs   Markegng  automa'on   Big  Data          Data  Mining                  Digital  Intelligence                        Operagonal  Intelligence                                      Low  Latency  and  NoSQL                                                  Cloud  Compugng  
  • 3. cleverdata.ru    |    info@cleverdata.ru   Агенда   •  Введение  в  RTB;   •  Потоки  данных;   •  Типы  данных;   •  Монетизация  данных;   •  Hadoop  vs.  Spark;   •  Что  дальше.  
  • 4. cleverdata.ru    |    info@cleverdata.ru   publishers   AD  NETWORK   AD  NETWORK   AD  NETWORK   AD  NETWORK   AD  NETWORK   AD  NETWORK   advergsers   D S   P   S S   P   Real  Time  Bidding  (RTB)  
  • 5. TRACKING  DATA   cleverdata.ru    |    info@cleverdata.ru   publishers   COOKIE  SYNCs   ACCESS  LOGS   PARTNER’S  DATA   3rd  PARTY  DATA   CLICK  STREAMS   advergsers   S S   P   D S   P   DMP   Data  Management  Pladorm  (DMP)  
  • 6. cleverdata.ru    |    info@cleverdata.ru   3rd  party   data   Relagonal  Data  Store   raw  data  3rd  party   data   3rd  party   data   Raw  Data  Store  &  Processing   RealTime  Data  Store   user  profiles  aggregates   Типовые  потоки  данных  
  • 7. cleverdata.ru    |    info@cleverdata.ru   Типовые  потоки  данных  ::  RTB   3rd  party   data   Relagonal  Data  Store   RTB   SRV   Exchange   SSP   bid  req.   bid  resp.   pixels  ::  impressions  ::  clicks   bid  requests   user  profiles   raw  data  3rd  party   data   3rd  party   data   Raw  Data  Store  &  Processing   RealTime  Data  Store   user  profiles  aggregates  
  • 8. cleverdata.ru    |    info@cleverdata.ru   1st-­‐party  data   3rd  party   data   Relagonal  Data  Store   RTB   SRV   Exchange   SSP   bid  req.   bid  resp.   pixels  ::  impressions  ::  clicks   bid  requests   user  profiles   raw  data  3rd  party   data   3rd  party   data   Raw  Data  Store  &  Processing   RealTime  Data  Store   user  profiles  aggregates  
  • 9. cleverdata.ru    |    info@cleverdata.ru   1st-­‐party  data   •  Зачем  монетизировать?   •  Как  монетизировать?     •  Чем  монетизировать?  
  • 10. cleverdata.ru    |    info@cleverdata.ru   Зачем  монетизировать?   Найти  всех  пользователей,  которые   участвовали  в  рекламной  кампании  “Star  Wars”  [и]   видели  один  из  баннеров  “Darth  Vader”  или  “Luke  Skywalker”     в  течении  последних  6  дней  [и]   кликнули  на  этот  баннер  [и]   посетили  страницу  покупки  светового  меча  Darth’а  Vader’а  [и]   но  так  ничего  и  не  купили   Для  того,  чтобы   сделать  ретаргетинг  персонифицированным  баннером  со   скидкой  на  меч  в  40%  
  • 11. cleverdata.ru    |    info@cleverdata.ru   find  all  users  who  have   taken  part  in  campaign[s]  “Star  Wars”  [and]   viewed  banner[s]  “Darth  Vader”  or  “Luke  Skywalker”   during  [last]  6  day[s]  [and]   clicked  banner[s]  “Darth  Vader's  lightsaber”  [and]   visited  buying  area  of  “Darth  Vader's  lightsaber”  [and]   not  visited  order  confirmed  area  of  “Darth  Vader's  lightsaber”   Как  монетизировать?   [impression]   [click]   [tr.  pixel]   [tr.  pixel]   id   cookie   event_id   event_type   campaign_id   gmestamp   …   1   c1   “Darth  Vader”     impression   “Star  Wars”     2015-­‐04-­‐20  14:25:11.462   …   2   c1   “Darth  Vader's  lightsaber”   click   “Star  Wars”     2015-­‐04-­‐21  06:31:12.157   …   3   c1   “Darth  Vader's  lightsaber”     tr.  pixel   “Star  Wars”     2015-­‐04-­‐22  18:57:19.628   …   [cookies]  
  • 12. cleverdata.ru    |    info@cleverdata.ru   Как  монетизировать?   reduce  find  all  users  who  have   taken  part  in  campaign[s]  “Star  Wars”       viewed  banner[s]  “Darth  Vader”  or   “Luke  Skywalker”  during  [last]  6  day[s]     clicked  banner[s]  “Darth  Vader's   lightsaber”     visited  buying  area  of  “Darth  Vader's   lightsaber”     not  visited  order  confirmed  area  of  “Darth   Vader's  lightsaber”   (c1,  0)   (c1,  1)   (c1,  2)   (c1,  3)   Ø   map   (c1,  0;1;2;3)       true(0)  and   true(1)  and   true(2)  and   true(3)  and                 not  false(4)   C1  
  • 13. cleverdata.ru    |    info@cleverdata.ru   Чем  монетизировать?   VS.  
  • 14. cleverdata.ru    |    info@cleverdata.ru   Spark  
  • 15. cleverdata.ru    |    info@cleverdata.ru   Перед  тем,  как  смотреть  на  Hadoop  
  • 16. cleverdata.ru    |    info@cleverdata.ru   Hadoop  Map-­‐Reduce  
  • 17. cleverdata.ru    |    info@cleverdata.ru   Hadoop  и  Spark:  Side  by  Side  ::  Hadoop   Инициализация     ü  protected  void  setup(Map.Context  context)   ü  protected  void  setup(Reduce.Context  context)   ü  protected  void  setup(XXX.Context  context)   ü  org.apache.hadoop.conf.Configured   ü  distributed  cache     Параллелизм     ü  mapred.reduce.tasks   ü  mapreduce.job.reduces   ü  spli›able  formats     Зависимости     ü  org.apache.hadoop.ugl.Tool     ü  org.apache.hadoop.ugl.ToolRunner  
  • 18. cleverdata.ru    |    info@cleverdata.ru   Hadoop  и  Spark  ::  Side  by  Side  ::  Spark   Инициализация     ü  mapRegion   ü  broadcast  vars     Параллелизм     ü  spark.default.parallelism   ü  num-­‐executors  и  executor-­‐cores  в  yarn   ü  numTasks  в  groupByKey,  reduceByKey,  aggregateByKey…     Зависимости     -­‐-­‐jars  hadoop-­‐ugls.jar,ad-­‐segmenter.jar   -­‐-­‐files  app.conf     -­‐-­‐driver-­‐java-­‐opgons=-­‐Dconfig.resource=app.conf   -­‐-­‐conf  config.resource=app.conf   -­‐-­‐conf  spark.driver.extraJavaOpgons=-­‐Dconfig.resource=app.conf         -­‐-­‐conf  spark.executor.extraJavaOpgons=-­‐Dconfig.resource=app.conf  
  • 19. cleverdata.ru    |    info@cleverdata.ru   Что  дальше  и  почему  Spark?   •  Spark  Streaming;   •  Micro  Batches;   •  λ-­‐архитектура.               без  серьезного  хирургического  вмешательства  
  • 20. cleverdata.ru    |    info@cleverdata.ru   Спасибо  за  вопросы!  
  • 21. info@cleverleaf.co.uk     ::   info@cleverdata.ru   cleverleaf.co.uk   ::   cleverdata.ru   1dmp.io   ::   crawler.1dmp.io   facebook.com/CleverData     ::   +7  (495)  967-­‐66-­‐50