SlideShare uma empresa Scribd logo
1 de 29
Baixar para ler offline
Гармония	
  
	
  платформы	
  управления	
  
данными	
  1DMP	
  и	
  	
  
Oracle	
  Big	
  Data	
  Appliance	
  
Сергей	
  Жемжицкий,	
  CTO	
  CleverDATA	
  
09	
  июля	
  2015	
  г.	
  
Company	
  Profile	
  
Mechanical	
  sympathy	
  of	
  Oracle	
  Big	
  Data	
  
Appliance	
  &	
  1DMP	
  pla]orm	
  
1DMP:	
  	
  Платформа	
  управления	
  данными	
  
Сергей	
  Жемжицкий,	
  	
  
CTO,	
  CleverDATA,	
  
9	
  июля,	
  2015	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Make	
  your	
  data	
  clever	
  
Развитие	
  	
  бизнеса	
  	
  
на	
  	
  международном	
  	
  
рынке	
  
Входит	
  в	
  тройку	
  
лидеров	
  российских	
  ИТ	
  компаний	
  
43	
  подразделения	
  в	
  России	
  и	
  за	
  
рубежом	
  
Более	
  7000	
  сотрудников	
  
100	
  тыс.проектов	
  для	
  10	
  тыс.заказчиков	
  
Решение	
  для	
  повышения	
  
эффективности	
  маркетинговых	
  
коммуникаций	
  для	
  B2C	
  компаний	
  
«Биржа»	
  данных	
  
Разработчик	
  систем	
  предиктивной	
  
аналитики	
  на	
  больших	
  данных	
  
Собственные	
  центры	
  разработки	
  
Партнерство	
  с	
  мировыми	
  лидерами	
  
Центр	
  экспертизы	
  по	
  технологиям	
  Big	
  
Data	
  и	
  Digital	
  Markebng	
  
1DMP	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Агенда	
  
•  Платформа	
  1DMP;	
  	
  
•  Задача	
  построения	
  профилей;	
  	
  
•  Результаты	
  тестирования	
  на	
  
Oracle	
  Big	
  Data	
  Appliance.	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Платформа	
  1DMP	
  
Основные	
  компоненты	
  
•  Raw	
  Data	
  Storage	
  –	
  хранение	
  «сырых»	
  данных	
  
•  Master	
  Data	
  Storage	
  –	
  хранение	
  готовых	
  аудиторных	
  
профилей	
  
•  Raw	
  Data	
  Loader	
  –	
  механизмы	
  загрузки	
  данных	
  из	
  внешних	
  
источников	
  
•  User	
  tracker	
  –	
  механизм	
  трекинга	
  пользователей,	
  поддержка	
  
таблицы	
  синхронизации,	
  синхронизация	
  трафика	
  с	
  
внешними	
  поставщиками	
  
•  Master	
  Data	
  Connector	
  –	
  API	
  работы	
  с	
  внешними	
  
потребителями	
  данных	
  (DSP/SSP)	
  
•  Web	
  Crawler	
  –	
  обогащение	
  данных	
  веб	
  контентом	
  из	
  
открытых	
  источников	
  
•  Predic|on	
  Engine	
  –	
  механизм	
  обработки	
  данных	
  алгоритмами	
  
машинного	
  обучения	
  
•  Rule	
  Based	
  Engine	
  –	
  механизм	
  обработки	
  данных	
  на	
  базе	
  
описываемых	
  правил	
  
•  Geo	
  Locator	
  –	
  компонент	
  обогащения	
  данных	
  данными	
  по	
  
геолокации	
  
•  Profile	
  builder	
  –	
  компонент	
  сбора	
  «интегрированного»	
  
профиля	
  пользователя	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Место	
  продукта	
  в	
  ИТ	
  инфраструктуре	
  
Customer	
  Transacbon	
  Data	
  	
  
Web	
  analybcs	
  
CRM	
  
DWH/CM/Call	
  center	
  
Company	
  Data	
  
Social	
  Data	
  	
  
Web	
  surfing	
  
eCommerce	
  Data	
  
3th	
  Party	
  Data	
  
Mobile	
  Data	
  
Data	
  Exchange	
  
3th	
  Party	
  Offline	
  Data	
  
BI	
  and	
  reporbng	
  
Company	
  Web	
  Site	
  
Mobile	
  Apps	
  
Company	
  acbvibes	
  
Customers	
  acbvibes	
  
Web	
  and	
  Mobile	
  
RTB	
  ecosystem	
  (DSP)	
  
Partners	
  web	
  and	
  mobile	
  
Social	
  
Web	
  
Email	
  
Campaign	
  Management	
  
Campaign	
  
management	
  
SMS	
  
Call	
  center	
  
Offline	
  
1DMP	
  
Big	
  Data	
  
storage	
  
Real	
  Time	
  
storage	
  
Predicbve	
  
analybcs	
  
Scoring	
  Data	
  	
  
Собрать	
  максимальное	
  
количество	
  данных	
  
Определить	
  что,	
  кому	
  и	
  
как	
  следует	
  предложить	
  
Донести	
  маркетинговое	
  
сообщение	
  до	
  клиента	
  
Open	
  Internet	
  
Data	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Задача	
  построения	
  профилей	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Поток	
  данных	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Протестированные	
  компоненты	
  
•  Raw	
  Data	
  Storage	
  –	
  хранение	
  «сырых»	
  данных	
  
•  Master	
  Data	
  Storage	
  –	
  хранение	
  готовых	
  аудиторных	
  
профилей	
  
•  Raw	
  Data	
  Loader	
  –	
  механизмы	
  загрузки	
  данных	
  из	
  внешних	
  
источников	
  
•  User	
  tracker	
  –	
  механизм	
  трекинга	
  пользователей,	
  поддержка	
  
таблицы	
  синхронизации,	
  синхронизация	
  трафика	
  с	
  
внешними	
  поставщиками	
  
•  Master	
  Data	
  Connector	
  –	
  API	
  работы	
  с	
  внешними	
  
потребителями	
  данных	
  (DSP/SSP)	
  
•  Web	
  Crawler	
  –	
  обогащение	
  данных	
  веб	
  контентом	
  из	
  
открытых	
  источников	
  
•  Predic|on	
  Engine	
  –	
  механизм	
  обработки	
  данных	
  алгоритмами	
  
машинного	
  обучения	
  
•  Rule	
  Based	
  Engine	
  –	
  механизм	
  обработки	
  данных	
  на	
  базе	
  
описываемых	
  правил	
  
•  Geo	
  Locator	
  –	
  компонент	
  обогащения	
  данных	
  данными	
  по	
  
геолокации	
  
•  Profile	
  builder	
  –	
  компонент	
  сбора	
  «интегрированного»	
  
профиля	
  пользователя	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Топология	
  развертывания	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Вызовы	
  
visitors	
   publishers	
  
adver|sers	
  100	
  ms	
  
50	
  ms	
  
20	
  ms	
  
10.000+	
  rps	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Hardware	
  
Hardware	
  (12	
  Nodes)	
  
•  Intel(R)	
  Xeon(R)	
  CPU	
  E5-­‐2699	
  v3	
  @	
  
2.30GHz,	
  36	
  physical	
  and	
  72	
  virtual	
  cores	
  	
  
•  128	
  GB	
  RAM	
  
•  12	
  x	
  4	
  TB	
  HDD	
  
•  20	
  GBPS	
  Infiniband	
  NICs	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
So‘ware	
  
So‘ware	
  
•  CDH	
  5.3.0	
  (Hadoop	
  2.5.0)	
  
•  Oracle	
  NoSQL	
  EE	
  3.2.5	
  
•  Wrk	
  (latest)	
  	
  
•  Nmon	
  14g	
  &	
  Analizer	
  4.0	
  	
  
Data	
  
•  73	
  GB	
  of	
  raw	
  gzipped	
  data	
  
•  6	
  x	
  106	
  of	
  HTML	
  pages	
  
•  256	
  MB	
  block	
  size	
  
•  512	
  bytes	
  messages	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Построение	
  профилей	
  из	
  
6x106	
  	
  HTML-­‐страниц	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Построение	
  профиля	
  	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Время	
  выполнения	
  от	
  количества	
  нод,	
  с	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
CPU-­‐|me	
  на	
  ноду,	
  с	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
CPU-­‐|me	
  на	
  ядро,	
  с	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
RAM	
  на	
  ноду,	
  GB	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Раздача	
  пользовательских	
  
профилей	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Раздача	
  профиля	
  	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Пропускная	
  способность	
  от	
  кол-­‐ва	
  ядер,	
  тыс.	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Время	
  отклика	
  от	
  кол-­‐ва	
  ядер,	
  90%	
  и	
  99%,	
  мс.	
  	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Утилизация	
  CPU	
  от	
  кол-­‐ва	
  ядер,	
  %	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Утилизация	
  NICs	
  от	
  кол-­‐ва	
  ядер,	
  тыс.	
  pps	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
Результаты	
  
cleverdata.ru	
  	
  |	
  	
  info@cleverdata.ru	
  
•  Раздача	
  пользовательских	
  профилей	
  с	
  одного	
  узла	
  Oracle	
  
Big	
  Data	
  Appliance	
  составила	
  более	
  101,5	
  тысяч	
  (в	
  1,45	
  раз	
  
больше	
   изначально	
   ожидаемого	
   числа)	
   запросов	
   в	
  
секунду;	
  
	
  
•  Время	
   отклика	
   на	
   запрос	
   в	
   99%	
   случаев	
   не	
   превысило	
  
1,17	
  миллисекунды	
  (в	
  1,7	
  раза	
  лучше	
  ожидаемого);	
  
	
  
•  Время	
   классификации	
   Интернет-­‐страниц	
   и	
   построение	
  
пользовательских	
   профилей	
   на	
   6	
   узлах	
   Oracle	
   Big	
   Data	
  
Appliance	
   составило	
   11	
   минут	
   17	
   секунд,	
   и	
   оказалось	
   в	
  
5,43	
  раза	
  лучше	
  ожидаемых	
  результатов.	
  
Результаты	
  
info@cleverleaf.co.uk	
  	
   ::	
   info@cleverdata.ru	
  
cleverleaf.co.uk	
   ::	
   cleverdata.ru	
  
1dmp.io	
   ::	
   crawler.1dmp.io	
  
facebook.com/CleverData	
  	
   ::	
   +7	
  (495)	
  967-­‐66-­‐50	
  	
  

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Тренды сегодня: Big Data
Тренды сегодня: Big DataТренды сегодня: Big Data
Тренды сегодня: Big Data
 
Большие данные в маркетинге: обработка, хранение, монетизация (Big Data 2017)
Большие данные в маркетинге: обработка, хранение, монетизация (Big Data 2017)Большие данные в маркетинге: обработка, хранение, монетизация (Big Data 2017)
Большие данные в маркетинге: обработка, хранение, монетизация (Big Data 2017)
 
Roman styatugin clever_data_cxp_predictive marketing
Roman styatugin clever_data_cxp_predictive marketingRoman styatugin clever_data_cxp_predictive marketing
Roman styatugin clever_data_cxp_predictive marketing
 
HR_Scoring_CleverDATA
HR_Scoring_CleverDATAHR_Scoring_CleverDATA
HR_Scoring_CleverDATA
 
Oracle big data for finance
Oracle big data for financeOracle big data for finance
Oracle big data for finance
 
РИФ 2016, Data Monetization - Как зарабатывать на данных 2.0
РИФ 2016, Data Monetization - Как зарабатывать на данных 2.0РИФ 2016, Data Monetization - Как зарабатывать на данных 2.0
РИФ 2016, Data Monetization - Как зарабатывать на данных 2.0
 
Больше DMP, хороших и разных
Больше DMP, хороших и разныхБольше DMP, хороших и разных
Больше DMP, хороших и разных
 
Clever d iab
Clever d  iabClever d  iab
Clever d iab
 
Fors и big data appliance
Fors и big data applianceFors и big data appliance
Fors и big data appliance
 
Big Data: Как принести пользу Бизнесу
Big Data: Как принести пользу БизнесуBig Data: Как принести пользу Бизнесу
Big Data: Как принести пользу Бизнесу
 
Splunk - универсальная платформа для работы с любыми данными
Splunk - универсальная платформа для работы с любыми даннымиSplunk - универсальная платформа для работы с любыми данными
Splunk - универсальная платформа для работы с любыми данными
 
Big data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризисаBig data как конкурентное преимущество в условиях кризиса
Big data как конкурентное преимущество в условиях кризиса
 
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьBig Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
 
Применение Big Data в маркетинге
Применение Big Data в маркетингеПрименение Big Data в маркетинге
Применение Big Data в маркетинге
 
SAP on Big Data Russia
SAP on Big Data RussiaSAP on Big Data Russia
SAP on Big Data Russia
 
Rtb-media.ru b2b presentation
Rtb-media.ru b2b presentationRtb-media.ru b2b presentation
Rtb-media.ru b2b presentation
 
FACETz for business
FACETz for businessFACETz for business
FACETz for business
 
Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015
 
CleverDATA_1DMP.RU_ for_enterprise
CleverDATA_1DMP.RU_ for_enterpriseCleverDATA_1DMP.RU_ for_enterprise
CleverDATA_1DMP.RU_ for_enterprise
 
Booster.DCA 2016
Booster.DCA 2016Booster.DCA 2016
Booster.DCA 2016
 

Destaque

Destaque (10)

MS BI
MS BI MS BI
MS BI
 
Визуализация данных в BI-проектах
Визуализация данных в BI-проектахВизуализация данных в BI-проектах
Визуализация данных в BI-проектах
 
Microsoft BI - практические сценарии применения
Microsoft BI - практические сценарии примененияMicrosoft BI - практические сценарии применения
Microsoft BI - практические сценарии применения
 
Бизнес-аналитика – не роскошь, а средство для принятия решений:
Бизнес-аналитика – не роскошь, а средство для принятия решений:Бизнес-аналитика – не роскошь, а средство для принятия решений:
Бизнес-аналитика – не роскошь, а средство для принятия решений:
 
03 элементы business intelligence в работе аналитика ч1
03 элементы business intelligence в работе аналитика ч103 элементы business intelligence в работе аналитика ч1
03 элементы business intelligence в работе аналитика ч1
 
04 элементы business intelligence в работе аналитика ч2
04 элементы business intelligence в работе аналитика ч204 элементы business intelligence в работе аналитика ч2
04 элементы business intelligence в работе аналитика ч2
 
BI - знания в деньги, CNews, Макаров
BI - знания в деньги, CNews, МакаровBI - знания в деньги, CNews, Макаров
BI - знания в деньги, CNews, Макаров
 
Video Business Intelligence Solutions for retail from CROC inc
Video Business Intelligence Solutions for retail from CROC incVideo Business Intelligence Solutions for retail from CROC inc
Video Business Intelligence Solutions for retail from CROC inc
 
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
 
ОСКР — Управление рекламой с Microsoft Power BI
ОСКР — Управление рекламой с Microsoft Power BIОСКР — Управление рекламой с Microsoft Power BI
ОСКР — Управление рекламой с Microsoft Power BI
 

Semelhante a CleverDATA_Oracle Cloud BI Day 2015

16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...
16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...
16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...
IT-Portfolio
 
Антон Петров "ЦОД во "времена перемен"
Антон Петров "ЦОД во "времена перемен"Антон Петров "ЦОД во "времена перемен"
Антон Петров "ЦОД во "времена перемен"
Anton Petrov
 
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dellCloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
Clouds NN
 
CloudsNN 2013 Мызгин Игорь. Есть ли жизнь за мкадом или облака для всех
CloudsNN 2013 Мызгин Игорь. Есть ли жизнь за мкадом или облака для всехCloudsNN 2013 Мызгин Игорь. Есть ли жизнь за мкадом или облака для всех
CloudsNN 2013 Мызгин Игорь. Есть ли жизнь за мкадом или облака для всех
Clouds NN
 
Настройка и оптимизация высоконагруженных J2EE веб-приложений / Шамим Ахмед (...
Настройка и оптимизация высоконагруженных J2EE веб-приложений / Шамим Ахмед (...Настройка и оптимизация высоконагруженных J2EE веб-приложений / Шамим Ахмед (...
Настройка и оптимизация высоконагруженных J2EE веб-приложений / Шамим Ахмед (...
Ontico
 
Виртуализация Данных: Введение
Виртуализация Данных: ВведениеВиртуализация Данных: Введение
Виртуализация Данных: Введение
Denodo
 

Semelhante a CleverDATA_Oracle Cloud BI Day 2015 (20)

доклад на вмк 15.10.2015
доклад на вмк 15.10.2015доклад на вмк 15.10.2015
доклад на вмк 15.10.2015
 
Принцип достаточности
Принцип достаточностиПринцип достаточности
Принцип достаточности
 
Diplom
DiplomDiplom
Diplom
 
Системы корпоративного инжиниринга Intergraph для комплексного проектировани...
Системы корпоративного инжиниринга Intergraph  для комплексного проектировани...Системы корпоративного инжиниринга Intergraph  для комплексного проектировани...
Системы корпоративного инжиниринга Intergraph для комплексного проектировани...
 
Защищенная веб-аналитика для банков, телекомов, медицинских центров
Защищенная веб-аналитика для банков, телекомов, медицинских центровЗащищенная веб-аналитика для банков, телекомов, медицинских центров
Защищенная веб-аналитика для банков, телекомов, медицинских центров
 
16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...
16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...
16 декабря, DEV {highload} - конференция о Highload веб-разработке, "Оптимиза...
 
Веб-аналитика для всех: WebTrends
Веб-аналитика для всех: WebTrendsВеб-аналитика для всех: WebTrends
Веб-аналитика для всех: WebTrends
 
Антон Петров "ЦОД во "времена перемен"
Антон Петров "ЦОД во "времена перемен"Антон Петров "ЦОД во "времена перемен"
Антон Петров "ЦОД во "времена перемен"
 
Предсказание вероятности конверсии на данных систем аналитики
Предсказание вероятности конверсии на данных систем аналитикиПредсказание вероятности конверсии на данных систем аналитики
Предсказание вероятности конверсии на данных систем аналитики
 
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dellCloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
CloudsNN 2013 Шевченко Анна. Облачная архитектура. решения от Hp и dell
 
Gpudigitallab experimental studio
Gpudigitallab experimental studioGpudigitallab experimental studio
Gpudigitallab experimental studio
 
Открытая сессия по виртуализации данных
Открытая сессия по виртуализации данныхОткрытая сессия по виртуализации данных
Открытая сессия по виртуализации данных
 
RST2014_Novosibirsk_NETGEN
RST2014_Novosibirsk_NETGENRST2014_Novosibirsk_NETGEN
RST2014_Novosibirsk_NETGEN
 
OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015
 
Bitblaze for GenerationS
Bitblaze for GenerationSBitblaze for GenerationS
Bitblaze for GenerationS
 
CloudsNN 2013 Мызгин Игорь. Есть ли жизнь за мкадом или облака для всех
CloudsNN 2013 Мызгин Игорь. Есть ли жизнь за мкадом или облака для всехCloudsNN 2013 Мызгин Игорь. Есть ли жизнь за мкадом или облака для всех
CloudsNN 2013 Мызгин Игорь. Есть ли жизнь за мкадом или облака для всех
 
Простая и дешёвая бизнес-аналитика на базе Google BigQuery / Алексей Паршуков...
Простая и дешёвая бизнес-аналитика на базе Google BigQuery / Алексей Паршуков...Простая и дешёвая бизнес-аналитика на базе Google BigQuery / Алексей Паршуков...
Простая и дешёвая бизнес-аналитика на базе Google BigQuery / Алексей Паршуков...
 
Ekran cloud ru
Ekran cloud ruEkran cloud ru
Ekran cloud ru
 
Настройка и оптимизация высоконагруженных J2EE веб-приложений / Шамим Ахмед (...
Настройка и оптимизация высоконагруженных J2EE веб-приложений / Шамим Ахмед (...Настройка и оптимизация высоконагруженных J2EE веб-приложений / Шамим Ахмед (...
Настройка и оптимизация высоконагруженных J2EE веб-приложений / Шамим Ахмед (...
 
Виртуализация Данных: Введение
Виртуализация Данных: ВведениеВиртуализация Данных: Введение
Виртуализация Данных: Введение
 

Mais de CleverDATA

Mais de CleverDATA (16)

CRM onboarding - оффлайн данные для онлайн рекламы
CRM onboarding - оффлайн данные для онлайн рекламы CRM onboarding - оффлайн данные для онлайн рекламы
CRM onboarding - оффлайн данные для онлайн рекламы
 
Jpoint 2017 - как это было (обзор конференции)
Jpoint 2017 - как это было (обзор конференции)Jpoint 2017 - как это было (обзор конференции)
Jpoint 2017 - как это было (обзор конференции)
 
Data exchange как ключевой элемент экосистемы обмена данными
Data exchange как ключевой элемент экосистемы обмена даннымиData exchange как ключевой элемент экосистемы обмена данными
Data exchange как ключевой элемент экосистемы обмена данными
 
Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...
Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...
Text mining of Beauty Blogs: о чем говорят женщины? (Артем Просветов, data sc...
 
Splunk for IT Operations and IT Service Intelligence
Splunk for IT Operations and IT Service IntelligenceSplunk for IT Operations and IT Service Intelligence
Splunk for IT Operations and IT Service Intelligence
 
CleverDATA_Afanasev_DigitalEconomy
CleverDATA_Afanasev_DigitalEconomyCleverDATA_Afanasev_DigitalEconomy
CleverDATA_Afanasev_DigitalEconomy
 
CleverDATA for Hadoop_Meetup_22052015_Spark_vs_Hadoop
CleverDATA for Hadoop_Meetup_22052015_Spark_vs_HadoopCleverDATA for Hadoop_Meetup_22052015_Spark_vs_Hadoop
CleverDATA for Hadoop_Meetup_22052015_Spark_vs_Hadoop
 
Julia Tuzin teradata omnichannel_interactions
Julia Tuzin teradata omnichannel_interactionsJulia Tuzin teradata omnichannel_interactions
Julia Tuzin teradata omnichannel_interactions
 
Karel jabornik teradata real-time-interaction_mngmt
Karel jabornik teradata real-time-interaction_mngmtKarel jabornik teradata real-time-interaction_mngmt
Karel jabornik teradata real-time-interaction_mngmt
 
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
 
CleverCLUB-26.03.15-K.Obukhov
CleverCLUB-26.03.15-K.ObukhovCleverCLUB-26.03.15-K.Obukhov
CleverCLUB-26.03.15-K.Obukhov
 
CleverCLUB-26.03.15-G.Kanevsky
CleverCLUB-26.03.15-G.KanevskyCleverCLUB-26.03.15-G.Kanevsky
CleverCLUB-26.03.15-G.Kanevsky
 
Predictive models for Operational analytics
Predictive models for Operational analyticsPredictive models for Operational analytics
Predictive models for Operational analytics
 
Digital Marketing Analytics on Splunk platform
Digital Marketing Analytics on Splunk platformDigital Marketing Analytics on Splunk platform
Digital Marketing Analytics on Splunk platform
 
10 Critical Mistakes in Data Analysis
10 Critical Mistakes in Data Analysis 10 Critical Mistakes in Data Analysis
10 Critical Mistakes in Data Analysis
 
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...
 

CleverDATA_Oracle Cloud BI Day 2015

  • 1. Гармония    платформы  управления   данными  1DMP  и     Oracle  Big  Data  Appliance   Сергей  Жемжицкий,  CTO  CleverDATA   09  июля  2015  г.  
  • 2. Company  Profile   Mechanical  sympathy  of  Oracle  Big  Data   Appliance  &  1DMP  pla]orm   1DMP:    Платформа  управления  данными   Сергей  Жемжицкий,     CTO,  CleverDATA,   9  июля,  2015  
  • 3. cleverdata.ru    |    info@cleverdata.ru   Make  your  data  clever   Развитие    бизнеса     на    международном     рынке   Входит  в  тройку   лидеров  российских  ИТ  компаний   43  подразделения  в  России  и  за   рубежом   Более  7000  сотрудников   100  тыс.проектов  для  10  тыс.заказчиков   Решение  для  повышения   эффективности  маркетинговых   коммуникаций  для  B2C  компаний   «Биржа»  данных   Разработчик  систем  предиктивной   аналитики  на  больших  данных   Собственные  центры  разработки   Партнерство  с  мировыми  лидерами   Центр  экспертизы  по  технологиям  Big   Data  и  Digital  Markebng   1DMP  
  • 4. cleverdata.ru    |    info@cleverdata.ru   Агенда   •  Платформа  1DMP;     •  Задача  построения  профилей;     •  Результаты  тестирования  на   Oracle  Big  Data  Appliance.  
  • 5. cleverdata.ru    |    info@cleverdata.ru   Платформа  1DMP  
  • 6. Основные  компоненты   •  Raw  Data  Storage  –  хранение  «сырых»  данных   •  Master  Data  Storage  –  хранение  готовых  аудиторных   профилей   •  Raw  Data  Loader  –  механизмы  загрузки  данных  из  внешних   источников   •  User  tracker  –  механизм  трекинга  пользователей,  поддержка   таблицы  синхронизации,  синхронизация  трафика  с   внешними  поставщиками   •  Master  Data  Connector  –  API  работы  с  внешними   потребителями  данных  (DSP/SSP)   •  Web  Crawler  –  обогащение  данных  веб  контентом  из   открытых  источников   •  Predic|on  Engine  –  механизм  обработки  данных  алгоритмами   машинного  обучения   •  Rule  Based  Engine  –  механизм  обработки  данных  на  базе   описываемых  правил   •  Geo  Locator  –  компонент  обогащения  данных  данными  по   геолокации   •  Profile  builder  –  компонент  сбора  «интегрированного»   профиля  пользователя   cleverdata.ru    |    info@cleverdata.ru  
  • 7. Место  продукта  в  ИТ  инфраструктуре   Customer  Transacbon  Data     Web  analybcs   CRM   DWH/CM/Call  center   Company  Data   Social  Data     Web  surfing   eCommerce  Data   3th  Party  Data   Mobile  Data   Data  Exchange   3th  Party  Offline  Data   BI  and  reporbng   Company  Web  Site   Mobile  Apps   Company  acbvibes   Customers  acbvibes   Web  and  Mobile   RTB  ecosystem  (DSP)   Partners  web  and  mobile   Social   Web   Email   Campaign  Management   Campaign   management   SMS   Call  center   Offline   1DMP   Big  Data   storage   Real  Time   storage   Predicbve   analybcs   Scoring  Data     Собрать  максимальное   количество  данных   Определить  что,  кому  и   как  следует  предложить   Донести  маркетинговое   сообщение  до  клиента   Open  Internet   Data   cleverdata.ru    |    info@cleverdata.ru  
  • 8. cleverdata.ru    |    info@cleverdata.ru   Задача  построения  профилей  
  • 9. cleverdata.ru    |    info@cleverdata.ru   Поток  данных  
  • 10. cleverdata.ru    |    info@cleverdata.ru   Протестированные  компоненты   •  Raw  Data  Storage  –  хранение  «сырых»  данных   •  Master  Data  Storage  –  хранение  готовых  аудиторных   профилей   •  Raw  Data  Loader  –  механизмы  загрузки  данных  из  внешних   источников   •  User  tracker  –  механизм  трекинга  пользователей,  поддержка   таблицы  синхронизации,  синхронизация  трафика  с   внешними  поставщиками   •  Master  Data  Connector  –  API  работы  с  внешними   потребителями  данных  (DSP/SSP)   •  Web  Crawler  –  обогащение  данных  веб  контентом  из   открытых  источников   •  Predic|on  Engine  –  механизм  обработки  данных  алгоритмами   машинного  обучения   •  Rule  Based  Engine  –  механизм  обработки  данных  на  базе   описываемых  правил   •  Geo  Locator  –  компонент  обогащения  данных  данными  по   геолокации   •  Profile  builder  –  компонент  сбора  «интегрированного»   профиля  пользователя  
  • 11. cleverdata.ru    |    info@cleverdata.ru   Топология  развертывания  
  • 12. cleverdata.ru    |    info@cleverdata.ru   Вызовы   visitors   publishers   adver|sers  100  ms   50  ms   20  ms   10.000+  rps  
  • 13. cleverdata.ru    |    info@cleverdata.ru   Hardware   Hardware  (12  Nodes)   •  Intel(R)  Xeon(R)  CPU  E5-­‐2699  v3  @   2.30GHz,  36  physical  and  72  virtual  cores     •  128  GB  RAM   •  12  x  4  TB  HDD   •  20  GBPS  Infiniband  NICs  
  • 14. cleverdata.ru    |    info@cleverdata.ru   So‘ware   So‘ware   •  CDH  5.3.0  (Hadoop  2.5.0)   •  Oracle  NoSQL  EE  3.2.5   •  Wrk  (latest)     •  Nmon  14g  &  Analizer  4.0     Data   •  73  GB  of  raw  gzipped  data   •  6  x  106  of  HTML  pages   •  256  MB  block  size   •  512  bytes  messages  
  • 15. cleverdata.ru    |    info@cleverdata.ru   Построение  профилей  из   6x106    HTML-­‐страниц  
  • 16. cleverdata.ru    |    info@cleverdata.ru   Построение  профиля    
  • 17. cleverdata.ru    |    info@cleverdata.ru   Время  выполнения  от  количества  нод,  с  
  • 18. cleverdata.ru    |    info@cleverdata.ru   CPU-­‐|me  на  ноду,  с  
  • 19. cleverdata.ru    |    info@cleverdata.ru   CPU-­‐|me  на  ядро,  с  
  • 20. cleverdata.ru    |    info@cleverdata.ru   RAM  на  ноду,  GB  
  • 21. cleverdata.ru    |    info@cleverdata.ru   Раздача  пользовательских   профилей  
  • 22. cleverdata.ru    |    info@cleverdata.ru   Раздача  профиля    
  • 23. cleverdata.ru    |    info@cleverdata.ru   Пропускная  способность  от  кол-­‐ва  ядер,  тыс.  
  • 24. cleverdata.ru    |    info@cleverdata.ru   Время  отклика  от  кол-­‐ва  ядер,  90%  и  99%,  мс.    
  • 25. cleverdata.ru    |    info@cleverdata.ru   Утилизация  CPU  от  кол-­‐ва  ядер,  %  
  • 26. cleverdata.ru    |    info@cleverdata.ru   Утилизация  NICs  от  кол-­‐ва  ядер,  тыс.  pps  
  • 27. cleverdata.ru    |    info@cleverdata.ru   Результаты  
  • 28. cleverdata.ru    |    info@cleverdata.ru   •  Раздача  пользовательских  профилей  с  одного  узла  Oracle   Big  Data  Appliance  составила  более  101,5  тысяч  (в  1,45  раз   больше   изначально   ожидаемого   числа)   запросов   в   секунду;     •  Время   отклика   на   запрос   в   99%   случаев   не   превысило   1,17  миллисекунды  (в  1,7  раза  лучше  ожидаемого);     •  Время   классификации   Интернет-­‐страниц   и   построение   пользовательских   профилей   на   6   узлах   Oracle   Big   Data   Appliance   составило   11   минут   17   секунд,   и   оказалось   в   5,43  раза  лучше  ожидаемых  результатов.   Результаты  
  • 29. info@cleverleaf.co.uk     ::   info@cleverdata.ru   cleverleaf.co.uk   ::   cleverdata.ru   1dmp.io   ::   crawler.1dmp.io   facebook.com/CleverData     ::   +7  (495)  967-­‐66-­‐50