SlideShare uma empresa Scribd logo
1 de 32
Baixar para ler offline
Революция	
  
	
  Больших	
  Данных	
  
	
  
www.visibletechologies.com
 	
  	
  Революция	
  Больших	
  Данных	
  
фото

фото

Май 2011

Высшая школа экономики, Москва, 2013

фото
Революция	
  Больших	
  Данных	
  
фото

фото

фото
Высшая школа экономики, Москва, 2013
Gartner	
  Hype	
  cycle	
  2013	
  

www.gartner.com
Прогноз	
  рынка	
  

Gartner: 2016- $55B 

www.wikibon.com
Data is the new oil. 
—European Consumer Commissioner Meglena Kuneva

Week of Aug 14, 2006:

XOM 69.10

AAPL 67.91

9K%
8K%
7K%
6K%

	
  Капитализация:	
  
–  Exxon - $387.2 B
–  Apple - $472.3 B	
  
	
  

5K%
4K%
3K%
2K%
1K%
0%
© 2013 Yahoo! Inc.
2003

2004

2005

2006

2007

2008

2009

2010

2011

2012

2013

Volume: 24,392,640
60.0M
40.0M
20.0M



Большие	
  Данные	
  
Явление характеризуемое быстрым увеличением объема
накапливаемых данных, скорости их поступления и
разнообразии источников

•  «Три V» характеристика:
•  Объем (Volume)
•  Скорость ( Velocity)
•  Разнообразие (Variety)

Высшая школа экономики, Москва, 2013
Источники	
  данных	
  
фото

фото

фото
Высшая школа экономики, Москва, 2013
Скорость	
  накопления	
  данных	
  
Библиотека Конгресса США содержит 33 млн книг,
всего 150 млн печатных изданий: 235 TB
2012:
•  Twitter: 175 млн tweet сообщений в день
•  Facebook: 300 млн загруженных фото в день
•  Google: 24 PB ежедневно
•  AT&T передает 30 PB в день
•  Walmart > 1 млн продаж в час
•  Кредитные карты > 10,000 транзакций в секунду
•  Boing 787 передает 0.5 TB телеметрических данных за
полет, 100 тыс. рейсов в день
	
  

Высшая школа экономики, Москва, 2013

фото

фото
Объемы	
  данных	
  
В 2011г «Цифровая Вселенная»

фото

1.8 ZETTABYTES
фото

1,800,000,000,000,000,000,000
Zetta

Exa

Peta

Tera

Giga

9 млн Библиотек Конгресса США

Mega

Kilo

Byte

60 млрд iPhone 32 GB
фото

К 2015 объем данных вырастет до 8 ZB, к 2020 в 44 раза до 35 ZB
Высшая школа экономики, Москва, 2013
Технологии	
  Больших	
  Данных	
  
• 
• 
• 
• 
• 
• 
• 
	
  

	
  
Основы технологии разработаны в
Google 2003, MapReduce
Открытое ПО, Hadoop (Yahoo)
Система массивно параллельной
обработки данных на кластерах дешевых
компьютеров
Значительное удешевление хранения
Экосистема Биг Дата стартапов:
Cloudera, MapR, HortonWorks
Крупные вендоры EMC, IBM, HP, Oracle
Большой вклад в открытые проекты:
Facebook, Twitter, Amazon, LinkedIn	
  
	
  	
  

фото

фото

фото
Высшая школа экономики, Москва, 2013
Big	
  Data	
  Landscape	
  2012	
  

www.bigdatalandscape.com
Big	
  Data	
  Landscape	
  2013	
  

www.bigdatalandscape.com
Подход	
  Больших	
  Данных	
  
Уникальность подхода Больших Данных
заключается в агрегировании огромной
информации из разных источников в
одном месте

•  Обобщенные вид на данные позволяет находить
скрытые связи и закономерности
•  Данные обладают огромной предсказательной силой
•  Доступны вычислительные мощности достаточные
для очень детальных расчетов

фото

фото

фото
Высшая школа экономики, Москва, 2013
Перспективы	
  Больших	
  Данных	
  

www.gartner.com
Бизнес	
  данных	
  	
  
•  Большие данные:
•  Хранение данных
•  Анализ данных
•  Data driven companies:
•  Принятие стратегических решений на основе данных
•  Создания продуктов основанные на данных
•  Предсказательная аналитика
Прикладные	
  задачи	
  
•  Маркетинг:
•  Сегментация рынка
•  Моделирование приобретения и оттока клиентов
•  Рекомендательные системы
•  Анализ социальных медиа

•  Финансовые и страховые компании:
•  Предотвращение fraud
•  Детектирование аномального поведения
•  Анализ кредитных рисков
•  Страховые моделирование

•  Здравоохранение и Фармакология:
•  Генетический анализ
•  Анализ клинических испытаний
•  Клинические системы принятия решений
Высшая школа экономики, Москва, 2013

•  Оптимизация портфолио
Портрет	
  компании:	
  Amazon	
  
Рекомендательная	
  система	
  

Product	
  A	
  

Product	
  B	
  

Product	
  C	
  
Портрет	
  компании:	
  LinkedIn	
  
Люди, которых вы можете знать

	
  	
  

238 mln members
 Портрет	
  компании:	
  Target	
  
“How companies learn your secrets”
•  Уникальный Guest ID
•  Транзакции по кредитной карте
•  Примеры факторов (сигналов):
• 
• 

Пищевые добавки кальций,
цинк, магний

• 
• 

Покупка крема без запаха

Мыло без запаха

Предсказательный «индекс»
беременности и ожидаемая
дата рождения
Предсказательное	
  моделирование	
  
•  Обучение	
  модели	
  

•  Применение	
  модели	
  

from Eric Siegel, “Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, or Die”
 Операторы	
  мобильной	
  связи	
  
• 

Churn prediction:  моделирование оттока клиентов

• 

Закономерности поведения подписчиков с течением времени

• 

Положительные и отрицательные примеры

Факторы модели:
•  История пользования сервисом (число звонков, смс)
•  История платежей за сервис
•  История обращений в службу поддержки
•  История изменений в контракте
•  Граф звонков (поведение друзей)
Моделирование	
  убеждаемости	
  

2012 US Presidential Elections:
• 

Предвыборная кампания Барака Обамы: 50 data scientists

• 

Собраны исторические данные exit polls

• 

Данные из открытых источников, соц. Сетей

• 

Предсказательные модели:
• 

Кто вероятно будет голосовать за Обаму?

• 

Кто вероятно будет голосовать за Ромни ?

• 

Кто придет в день голосование на участки?

• 

Кого можно убедить голосовать за Обаму в случае
личного общения?
Галерея	
  проектов	
  
Примеры небольших компаний и проектов создающих data driven products
Сбор и обработка массивов данных
•  Стартапы, небольшие проекты

фото

•  Частное и государственное финансирование
•  Social course ( социальная направленность)

фото
Высшая школа экономики, Москва, 2013
Большие	
  Данные	
  в	
  городе:	
  удобный	
  город	
  
Сан-Франциско: датчики парковки, датчики скорости
транспортных потоков, GPS в общественном
транспорте

фото

фото

Использование:
•  нахождение свободных парковок
•  точное время прибытия  общественного
транспорта
Высшая школа экономики, Москва, 2013

фото
Большие	
  Данные	
  в	
  городе:	
  безопасный	
  	
  город	
  
Лос-Анджелес: предсказания преступлений
LAPD (predictive policing, 2011-2013):

фото

•  Определение мест и времени с повышенной
вероятностью совершения преступлений
•  Исторические данные о преступности в городе
(80 месяцев), демографические и др. данные,
социологические модели

фото

•  Преступления против собственности снизились
за год на 12%
•  UCLA, UC Santa Cruz

Высшая школа экономики, Москва, 2013

фото
Большие	
  Данные	
  в	
  экономике	
  
•  MIT научный проект, Billion Prices Project
•  Ежедневно собирают с е-магазинов цены на
товары:
фото
•  > 900 магазинов, 70 стран, 5 млн товаров
•  Автоматически вычисляют:
•  Индекс потребительских цен
•  Уровень инфляции
•  Бюро Статистики труда: 90 городов, 80,000 The key advantage of our series is the ability to anticipate major
shifts in underlying inflation trends
фото
товаров, сотни сотрудников, $250 млн
в год,
задержка 2-4 недели
Example: State Street PriceStats US Aggregate Inflation Series

May 2011

Jan 2012

online

09/15/2008
Lehman’s Bankruptcy

January 2011

12/20/2008

фото
Source: BPP – PriceStats – BLS (CPI-U, US city-average, all items, NSA)

Высшая школа экономики, Москва, 2013

7
Большие	
  Данные	
  и	
  здоровье	
  
Платформa	
  мониторинга	
  астмы	
  и	
  других	
  
респираторных	
  заболеваний	
  
•  Помогать	
  пациентам	
  и	
  врачам	
  лучше	
  справляется	
  с	
  
заболеванием	
  

фото

•  Ингаляторы	
  с	
  встроенными	
  сенсорами,	
  мобильные	
  
приложения	
  
•  Дневник	
  пациента,	
  доступен	
  врачу	
  онлайн	
  
•  Неотложная	
  помощь	
  
•  Глобальная	
  аналитика	
  по	
  заболеванию	
  

фото

Системы	
  	
  self-­‐мониторинга	
  (quanXfy-­‐self):	
  
•  Fitbit,	
  Jawbone:	
  физические	
  нагрузка	
  
•  Wahoo:	
  сердечный	
  ритм	
  
•  Zeo:	
  ночной	
  сон	
  (EEG)	
  
•  AliveCor:	
  одноканальная	
  кардиограмма	
  (ECG)
Высшая школа экономики, Москва, 2013

фото
Большие	
  Данные	
  в	
  образовании	
  
Платформа онлайн обучения
• 

MOOC (Massive Online Open Course)

• 

“Ivy League” для масс

• 

Лучшие курсы лучших университетов

• 

Повсеместная доступность

• 

Универсальность программы обучения

• 

Бесплатное обучение

• 

Coursera, edX, Udemy

фото

фото

Coursera:
•  Первые 2 курса из Стэнфорда в 2012
•  80 университетов, 400 курсов
•  200,000 студентов на курсе
•  4.5млн обучаемых
Высшая школа экономики, Москва, 2013

фото
st	
  	
  Century	
  
The	
  Sexiest	
  Job	
  of	
  the	
  21

McKinsey оценивает
нехватку в
140,000-190,000
специалистов к 2018г
Высшая школа экономики, Москва, 2013
Контакты	
  
•  Леонид	
  Жуков,	
  	
  Ph.D	
  
•  Профессор,	
  Отделение	
  Прикладной	
  Математики	
  и	
  Информатики,	
  
Высшая	
  Школа	
  Экономики	
  (НИУ-­‐ВШЭ)	
  
•  Director	
  Data	
  Science,	
  Ancestry.com	
  	
  
•  lzhukov@hse.ru	
  
•  www.leonidzhukov.ru	
  

Mais conteúdo relacionado

Mais procurados

Подготовка специалистов по анализу больших данных: все аспекты
Подготовка специалистов по анализу больших данных: все аспектыПодготовка специалистов по анализу больших данных: все аспекты
Подготовка специалистов по анализу больших данных: все аспектыEvgeniy Pavlovskiy
 
OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015Ilya Gershanov
 
Big Data Technology - Solit 2015 Conference
Big Data Technology - Solit 2015 ConferenceBig Data Technology - Solit 2015 Conference
Big Data Technology - Solit 2015 ConferenceDmitry Tolpeko
 
TAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - МакаровTAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - МакаровStanislav Makarov
 
Big Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователяBig Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователяСобака Павлова
 
Чем отличаются BI и Big Data?
Чем отличаются BI и Big Data?Чем отличаются BI и Big Data?
Чем отличаются BI и Big Data?Michael Kozloff
 
Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...
Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...
Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...Банковское обозрение
 
Query hunter презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙ
Query hunter  презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙQuery hunter  презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙ
Query hunter презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙqueryhunter
 
Аналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboardАналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboardIpo Board
 
1 алексей натекин глубокая социальная аналиктика маленький большой брат
1 алексей натекин глубокая социальная аналиктика маленький большой брат1 алексей натекин глубокая социальная аналиктика маленький большой брат
1 алексей натекин глубокая социальная аналиктика маленький большой братantishmanti
 

Mais procurados (12)

Подготовка специалистов по анализу больших данных: все аспекты
Подготовка специалистов по анализу больших данных: все аспектыПодготовка специалистов по анализу больших данных: все аспекты
Подготовка специалистов по анализу больших данных: все аспекты
 
Stolyarevska_data_scientist
Stolyarevska_data_scientistStolyarevska_data_scientist
Stolyarevska_data_scientist
 
OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015OSPconf. Big Data Forum 2015
OSPconf. Big Data Forum 2015
 
Big Data Technology - Solit 2015 Conference
Big Data Technology - Solit 2015 ConferenceBig Data Technology - Solit 2015 Conference
Big Data Technology - Solit 2015 Conference
 
TAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - МакаровTAdviser - BI-Big Data - Макаров
TAdviser - BI-Big Data - Макаров
 
РИФ 2016, Предикативная аналитика
РИФ 2016, Предикативная аналитикаРИФ 2016, Предикативная аналитика
РИФ 2016, Предикативная аналитика
 
Big Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователяBig Data с точки зрения конечного пользователя
Big Data с точки зрения конечного пользователя
 
Чем отличаются BI и Big Data?
Чем отличаются BI и Big Data?Чем отличаются BI и Big Data?
Чем отличаются BI и Big Data?
 
Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...
Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...
Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...
 
Query hunter презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙ
Query hunter  презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙQuery hunter  презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙ
Query hunter презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙ
 
Аналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboardАналитический обзор рынка Больших Данных от IPOboard
Аналитический обзор рынка Больших Данных от IPOboard
 
1 алексей натекин глубокая социальная аналиктика маленький большой брат
1 алексей натекин глубокая социальная аналиктика маленький большой брат1 алексей натекин глубокая социальная аналиктика маленький большой брат
1 алексей натекин глубокая социальная аналиктика маленький большой брат
 

Destaque

ancestry-bigdatasummit-april2013
ancestry-bigdatasummit-april2013ancestry-bigdatasummit-april2013
ancestry-bigdatasummit-april2013Leonid Zhukov
 
Russian Big Data Startups
Russian Big Data StartupsRussian Big Data Startups
Russian Big Data StartupsLeonid Zhukov
 
Numerical Linear Algebra for Data and Link Analysis
Numerical Linear Algebra for Data and Link AnalysisNumerical Linear Algebra for Data and Link Analysis
Numerical Linear Algebra for Data and Link AnalysisLeonid Zhukov
 
Ecosystem challenges around data use
Ecosystem challenges around data useEcosystem challenges around data use
Ecosystem challenges around data useLeonid Zhukov
 
Social Networks: from Micromotives to Macrobehavior
Social Networks: from Micromotives to MacrobehaviorSocial Networks: from Micromotives to Macrobehavior
Social Networks: from Micromotives to MacrobehaviorLeonid Zhukov
 
Business of Big Data
Business of Big DataBusiness of Big Data
Business of Big DataLeonid Zhukov
 
Big Data at Ancestry.com
Big Data at Ancestry.comBig Data at Ancestry.com
Big Data at Ancestry.comLeonid Zhukov
 
socialnetworkszhukov
socialnetworkszhukovsocialnetworkszhukov
socialnetworkszhukovLeonid Zhukov
 
Инфорамционные каскады
Инфорамционные каскадыИнфорамционные каскады
Инфорамционные каскадыLeonid Zhukov
 
Oriented Tensor Reconstruction. Tracing Neural Pathways from DT-MRI
Oriented Tensor Reconstruction. Tracing Neural Pathways from DT-MRIOriented Tensor Reconstruction. Tracing Neural Pathways from DT-MRI
Oriented Tensor Reconstruction. Tracing Neural Pathways from DT-MRILeonid Zhukov
 
Vis03 Workshop. DT-MRI Visualization
Vis03 Workshop. DT-MRI VisualizationVis03 Workshop. DT-MRI Visualization
Vis03 Workshop. DT-MRI VisualizationLeonid Zhukov
 
Social Network Analysis
Social Network AnalysisSocial Network Analysis
Social Network AnalysisLeonid Zhukov
 
Information cascades
Information cascadesInformation cascades
Information cascadesLeonid Zhukov
 
Numerical Linear Algebra for Data and Link Analysis.
Numerical Linear Algebra for Data and Link Analysis.Numerical Linear Algebra for Data and Link Analysis.
Numerical Linear Algebra for Data and Link Analysis.Leonid Zhukov
 

Destaque (17)

Data Scientists
 Data Scientists Data Scientists
Data Scientists
 
ancestry-bigdatasummit-april2013
ancestry-bigdatasummit-april2013ancestry-bigdatasummit-april2013
ancestry-bigdatasummit-april2013
 
Russian Big Data Startups
Russian Big Data StartupsRussian Big Data Startups
Russian Big Data Startups
 
Numerical Linear Algebra for Data and Link Analysis
Numerical Linear Algebra for Data and Link AnalysisNumerical Linear Algebra for Data and Link Analysis
Numerical Linear Algebra for Data and Link Analysis
 
Ecosystem challenges around data use
Ecosystem challenges around data useEcosystem challenges around data use
Ecosystem challenges around data use
 
Social Networks: from Micromotives to Macrobehavior
Social Networks: from Micromotives to MacrobehaviorSocial Networks: from Micromotives to Macrobehavior
Social Networks: from Micromotives to Macrobehavior
 
Business of Big Data
Business of Big DataBusiness of Big Data
Business of Big Data
 
Big Data at Ancestry.com
Big Data at Ancestry.comBig Data at Ancestry.com
Big Data at Ancestry.com
 
socialnetworkszhukov
socialnetworkszhukovsocialnetworkszhukov
socialnetworkszhukov
 
Social Networks
Social NetworksSocial Networks
Social Networks
 
Monitorium DLP
Monitorium DLPMonitorium DLP
Monitorium DLP
 
Инфорамционные каскады
Инфорамционные каскадыИнфорамционные каскады
Инфорамционные каскады
 
Oriented Tensor Reconstruction. Tracing Neural Pathways from DT-MRI
Oriented Tensor Reconstruction. Tracing Neural Pathways from DT-MRIOriented Tensor Reconstruction. Tracing Neural Pathways from DT-MRI
Oriented Tensor Reconstruction. Tracing Neural Pathways from DT-MRI
 
Vis03 Workshop. DT-MRI Visualization
Vis03 Workshop. DT-MRI VisualizationVis03 Workshop. DT-MRI Visualization
Vis03 Workshop. DT-MRI Visualization
 
Social Network Analysis
Social Network AnalysisSocial Network Analysis
Social Network Analysis
 
Information cascades
Information cascadesInformation cascades
Information cascades
 
Numerical Linear Algebra for Data and Link Analysis.
Numerical Linear Algebra for Data and Link Analysis.Numerical Linear Algebra for Data and Link Analysis.
Numerical Linear Algebra for Data and Link Analysis.
 

Semelhante a Революция Больших Данных

Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Evgeniy Pavlovskiy
 
Александр Шестаков и Дмитрий Буров, Sape и Likeberi: "Bigdata"
Александр Шестаков и Дмитрий Буров, Sape и Likeberi: "Bigdata"Александр Шестаков и Дмитрий Буров, Sape и Likeberi: "Bigdata"
Александр Шестаков и Дмитрий Буров, Sape и Likeberi: "Bigdata"web2win
 
Как запустить рекламу будущего Александр Шестаков (Руководитель отдела по раб...
Как запустить рекламу будущего Александр Шестаков (Руководитель отдела по раб...Как запустить рекламу будущего Александр Шестаков (Руководитель отдела по раб...
Как запустить рекламу будущего Александр Шестаков (Руководитель отдела по раб...BranchMarketing
 
Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Marina Payvina
 
Графовый Грааль - Южный ИТ-парк 2015
Графовый Грааль - Южный ИТ-парк 2015Графовый Грааль - Южный ИТ-парк 2015
Графовый Грааль - Южный ИТ-парк 2015Vic N
 
AlgoMost presentation
AlgoMost presentationAlgoMost presentation
AlgoMost presentationAlgoMost
 
современные методы анализа данных для бизнеса в стиле Google(2)
современные методы анализа данных для бизнеса в стиле Google(2)современные методы анализа данных для бизнеса в стиле Google(2)
современные методы анализа данных для бизнеса в стиле Google(2)DataConsulting2013
 
SAP on Big Data Russia
SAP on Big Data RussiaSAP on Big Data Russia
SAP on Big Data Russiarusbase.vc
 
Cвятослав Штумпф, Петер-Сервис: Грамотное использование Big Data
Cвятослав Штумпф, Петер-Сервис: Грамотное использование Big DataCвятослав Штумпф, Петер-Сервис: Грамотное использование Big Data
Cвятослав Штумпф, Петер-Сервис: Грамотное использование Big DataB2BConferenceGroup
 
BigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBranchMarketing
 
Тренды сегодня: Big Data
Тренды сегодня: Big DataТренды сегодня: Big Data
Тренды сегодня: Big DataAndrey Kazakevich
 
Интеграция данных компании
Интеграция данных компанииИнтеграция данных компании
Интеграция данных компанииDatamodel
 
Графовый Грааль - в заочный ФРИИ (10.09.2014)
Графовый Грааль - в заочный ФРИИ (10.09.2014)Графовый Грааль - в заочный ФРИИ (10.09.2014)
Графовый Грааль - в заочный ФРИИ (10.09.2014)Vic N
 
Логическая витрина для доступа к большим данным
Логическая витрина для доступа к большим даннымЛогическая витрина для доступа к большим данным
Логическая витрина для доступа к большим даннымSergey Gorshkov
 
От больших данных к знаниям: преимущества для операторов связи
От больших данных к знаниям: преимущества для операторов связиОт больших данных к знаниям: преимущества для операторов связи
От больших данных к знаниям: преимущества для операторов связиElizaveta Alekseeva
 

Semelhante a Революция Больших Данных (20)

Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии
 
Александр Шестаков и Дмитрий Буров, Sape и Likeberi: "Bigdata"
Александр Шестаков и Дмитрий Буров, Sape и Likeberi: "Bigdata"Александр Шестаков и Дмитрий Буров, Sape и Likeberi: "Bigdata"
Александр Шестаков и Дмитрий Буров, Sape и Likeberi: "Bigdata"
 
Как запустить рекламу будущего Александр Шестаков (Руководитель отдела по раб...
Как запустить рекламу будущего Александр Шестаков (Руководитель отдела по раб...Как запустить рекламу будущего Александр Шестаков (Руководитель отдела по раб...
Как запустить рекламу будущего Александр Шестаков (Руководитель отдела по раб...
 
Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?
 
Графовый Грааль - Южный ИТ-парк 2015
Графовый Грааль - Южный ИТ-парк 2015Графовый Грааль - Южный ИТ-парк 2015
Графовый Грааль - Южный ИТ-парк 2015
 
AlgoMost: about
AlgoMost: aboutAlgoMost: about
AlgoMost: about
 
AlgoMost presentation
AlgoMost presentationAlgoMost presentation
AlgoMost presentation
 
современные методы анализа данных для бизнеса в стиле Google(2)
современные методы анализа данных для бизнеса в стиле Google(2)современные методы анализа данных для бизнеса в стиле Google(2)
современные методы анализа данных для бизнеса в стиле Google(2)
 
SAP on Big Data Russia
SAP on Big Data RussiaSAP on Big Data Russia
SAP on Big Data Russia
 
Cвятослав Штумпф, Петер-Сервис: Грамотное использование Big Data
Cвятослав Штумпф, Петер-Сервис: Грамотное использование Big DataCвятослав Штумпф, Петер-Сервис: Грамотное использование Big Data
Cвятослав Штумпф, Петер-Сервис: Грамотное использование Big Data
 
BigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнеса
 
Big data, бизнес, CRM
Big data, бизнес, CRMBig data, бизнес, CRM
Big data, бизнес, CRM
 
AlgoMost: about
AlgoMost: aboutAlgoMost: about
AlgoMost: about
 
Тренды сегодня: Big Data
Тренды сегодня: Big DataТренды сегодня: Big Data
Тренды сегодня: Big Data
 
Интеграция данных компании
Интеграция данных компанииИнтеграция данных компании
Интеграция данных компании
 
Графовый Грааль - в заочный ФРИИ (10.09.2014)
Графовый Грааль - в заочный ФРИИ (10.09.2014)Графовый Грааль - в заочный ФРИИ (10.09.2014)
Графовый Грааль - в заочный ФРИИ (10.09.2014)
 
Choister
ChoisterChoister
Choister
 
Choister
ChoisterChoister
Choister
 
Логическая витрина для доступа к большим данным
Логическая витрина для доступа к большим даннымЛогическая витрина для доступа к большим данным
Логическая витрина для доступа к большим данным
 
От больших данных к знаниям: преимущества для операторов связи
От больших данных к знаниям: преимущества для операторов связиОт больших данных к знаниям: преимущества для операторов связи
От больших данных к знаниям: преимущества для операторов связи
 

Революция Больших Данных

  • 3.      Революция  Больших  Данных   фото фото Май 2011
 Высшая школа экономики, Москва, 2013 фото
  • 4. Революция  Больших  Данных   фото фото фото Высшая школа экономики, Москва, 2013
  • 5. Gartner  Hype  cycle  2013   www.gartner.com
  • 6. Прогноз  рынка   Gartner: 2016- $55B www.wikibon.com
  • 7. Data is the new oil. —European Consumer Commissioner Meglena Kuneva Week of Aug 14, 2006: XOM 69.10 AAPL 67.91 9K% 8K% 7K% 6K%  Капитализация:   –  Exxon - $387.2 B –  Apple - $472.3 B     5K% 4K% 3K% 2K% 1K% 0% © 2013 Yahoo! Inc. 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 Volume: 24,392,640 60.0M 40.0M 20.0M
  • 8. 
 Большие  Данные   Явление характеризуемое быстрым увеличением объема накапливаемых данных, скорости их поступления и разнообразии источников •  «Три V» характеристика: •  Объем (Volume) •  Скорость ( Velocity) •  Разнообразие (Variety) Высшая школа экономики, Москва, 2013
  • 9. Источники  данных   фото фото фото Высшая школа экономики, Москва, 2013
  • 10. Скорость  накопления  данных   Библиотека Конгресса США содержит 33 млн книг, всего 150 млн печатных изданий: 235 TB 2012: •  Twitter: 175 млн tweet сообщений в день •  Facebook: 300 млн загруженных фото в день •  Google: 24 PB ежедневно •  AT&T передает 30 PB в день •  Walmart > 1 млн продаж в час •  Кредитные карты > 10,000 транзакций в секунду •  Boing 787 передает 0.5 TB телеметрических данных за полет, 100 тыс. рейсов в день   Высшая школа экономики, Москва, 2013 фото фото
  • 11. Объемы  данных   В 2011г «Цифровая Вселенная» фото 1.8 ZETTABYTES фото 1,800,000,000,000,000,000,000 Zetta Exa Peta Tera Giga 9 млн Библиотек Конгресса США Mega Kilo Byte 60 млрд iPhone 32 GB фото К 2015 объем данных вырастет до 8 ZB, к 2020 в 44 раза до 35 ZB Высшая школа экономики, Москва, 2013
  • 12. Технологии  Больших  Данных   •  •  •  •  •  •  •      Основы технологии разработаны в Google 2003, MapReduce Открытое ПО, Hadoop (Yahoo) Система массивно параллельной обработки данных на кластерах дешевых компьютеров Значительное удешевление хранения Экосистема Биг Дата стартапов: Cloudera, MapR, HortonWorks Крупные вендоры EMC, IBM, HP, Oracle Большой вклад в открытые проекты: Facebook, Twitter, Amazon, LinkedIn       фото фото фото Высшая школа экономики, Москва, 2013
  • 13. Big  Data  Landscape  2012   www.bigdatalandscape.com
  • 14. Big  Data  Landscape  2013   www.bigdatalandscape.com
  • 15. Подход  Больших  Данных   Уникальность подхода Больших Данных заключается в агрегировании огромной информации из разных источников в одном месте •  Обобщенные вид на данные позволяет находить скрытые связи и закономерности •  Данные обладают огромной предсказательной силой •  Доступны вычислительные мощности достаточные для очень детальных расчетов фото фото фото Высшая школа экономики, Москва, 2013
  • 17. Бизнес  данных     •  Большие данные: •  Хранение данных •  Анализ данных •  Data driven companies: •  Принятие стратегических решений на основе данных •  Создания продуктов основанные на данных •  Предсказательная аналитика
  • 18. Прикладные  задачи   •  Маркетинг: •  Сегментация рынка •  Моделирование приобретения и оттока клиентов •  Рекомендательные системы •  Анализ социальных медиа •  Финансовые и страховые компании: •  Предотвращение fraud •  Детектирование аномального поведения •  Анализ кредитных рисков •  Страховые моделирование •  Здравоохранение и Фармакология: •  Генетический анализ •  Анализ клинических испытаний •  Клинические системы принятия решений Высшая школа экономики, Москва, 2013 •  Оптимизация портфолио
  • 19. Портрет  компании:  Amazon   Рекомендательная  система   Product  A   Product  B   Product  C  
  • 20. Портрет  компании:  LinkedIn   Люди, которых вы можете знать     238 mln members
  • 21.  Портрет  компании:  Target   “How companies learn your secrets” •  Уникальный Guest ID •  Транзакции по кредитной карте •  Примеры факторов (сигналов): •  •  Пищевые добавки кальций, цинк, магний •  •  Покупка крема без запаха Мыло без запаха Предсказательный «индекс» беременности и ожидаемая дата рождения
  • 22. Предсказательное  моделирование   •  Обучение  модели   •  Применение  модели   from Eric Siegel, “Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, or Die”
  • 23.  Операторы  мобильной  связи   •  Churn prediction:  моделирование оттока клиентов •  Закономерности поведения подписчиков с течением времени •  Положительные и отрицательные примеры Факторы модели: •  История пользования сервисом (число звонков, смс) •  История платежей за сервис •  История обращений в службу поддержки •  История изменений в контракте •  Граф звонков (поведение друзей)
  • 24. Моделирование  убеждаемости   2012 US Presidential Elections: •  Предвыборная кампания Барака Обамы: 50 data scientists •  Собраны исторические данные exit polls •  Данные из открытых источников, соц. Сетей •  Предсказательные модели: •  Кто вероятно будет голосовать за Обаму? •  Кто вероятно будет голосовать за Ромни ? •  Кто придет в день голосование на участки? •  Кого можно убедить голосовать за Обаму в случае личного общения?
  • 25. Галерея  проектов   Примеры небольших компаний и проектов создающих data driven products Сбор и обработка массивов данных •  Стартапы, небольшие проекты фото •  Частное и государственное финансирование •  Social course ( социальная направленность) фото Высшая школа экономики, Москва, 2013
  • 26. Большие  Данные  в  городе:  удобный  город   Сан-Франциско: датчики парковки, датчики скорости транспортных потоков, GPS в общественном транспорте фото фото Использование: •  нахождение свободных парковок •  точное время прибытия  общественного транспорта Высшая школа экономики, Москва, 2013 фото
  • 27. Большие  Данные  в  городе:  безопасный    город   Лос-Анджелес: предсказания преступлений LAPD (predictive policing, 2011-2013): фото •  Определение мест и времени с повышенной вероятностью совершения преступлений •  Исторические данные о преступности в городе (80 месяцев), демографические и др. данные, социологические модели фото •  Преступления против собственности снизились за год на 12% •  UCLA, UC Santa Cruz Высшая школа экономики, Москва, 2013 фото
  • 28. Большие  Данные  в  экономике   •  MIT научный проект, Billion Prices Project •  Ежедневно собирают с е-магазинов цены на товары: фото •  > 900 магазинов, 70 стран, 5 млн товаров •  Автоматически вычисляют: •  Индекс потребительских цен •  Уровень инфляции •  Бюро Статистики труда: 90 городов, 80,000 The key advantage of our series is the ability to anticipate major shifts in underlying inflation trends фото товаров, сотни сотрудников, $250 млн в год, задержка 2-4 недели Example: State Street PriceStats US Aggregate Inflation Series May 2011 Jan 2012 online 09/15/2008 Lehman’s Bankruptcy January 2011 12/20/2008 фото Source: BPP – PriceStats – BLS (CPI-U, US city-average, all items, NSA) Высшая школа экономики, Москва, 2013 7
  • 29. Большие  Данные  и  здоровье   Платформa  мониторинга  астмы  и  других   респираторных  заболеваний   •  Помогать  пациентам  и  врачам  лучше  справляется  с   заболеванием   фото •  Ингаляторы  с  встроенными  сенсорами,  мобильные   приложения   •  Дневник  пациента,  доступен  врачу  онлайн   •  Неотложная  помощь   •  Глобальная  аналитика  по  заболеванию   фото Системы    self-­‐мониторинга  (quanXfy-­‐self):   •  Fitbit,  Jawbone:  физические  нагрузка   •  Wahoo:  сердечный  ритм   •  Zeo:  ночной  сон  (EEG)   •  AliveCor:  одноканальная  кардиограмма  (ECG) Высшая школа экономики, Москва, 2013 фото
  • 30. Большие  Данные  в  образовании   Платформа онлайн обучения •  MOOC (Massive Online Open Course) •  “Ivy League” для масс •  Лучшие курсы лучших университетов •  Повсеместная доступность •  Универсальность программы обучения •  Бесплатное обучение •  Coursera, edX, Udemy фото фото Coursera: •  Первые 2 курса из Стэнфорда в 2012 •  80 университетов, 400 курсов •  200,000 студентов на курсе •  4.5млн обучаемых Высшая школа экономики, Москва, 2013 фото
  • 31. st    Century   The  Sexiest  Job  of  the  21 McKinsey оценивает нехватку в 140,000-190,000 специалистов к 2018г Высшая школа экономики, Москва, 2013
  • 32. Контакты   •  Леонид  Жуков,    Ph.D   •  Профессор,  Отделение  Прикладной  Математики  и  Информатики,   Высшая  Школа  Экономики  (НИУ-­‐ВШЭ)   •  Director  Data  Science,  Ancestry.com     •  lzhukov@hse.ru   •  www.leonidzhukov.ru