SlideShare uma empresa Scribd logo
1 de 22
Презентация по предмету
Хранилища данных
На тему
Data mining
Выполнила студентка
Группы 472(2)
Байдалина Любовь
Москва 2010
Термин Data Mining часто
переводится как:
• добыча данных
•извлечение информации
•раскопка данных
•интеллектуальный
анализ данных
•средства
поиска закономерностей
•извлечение знаний
•анализ шаблонов
•раскопка знаний в
базах данных
•информационная
проходка данных
Data
Mining
Теория БД
Статистика
Визуализация
Машинное
обучение
Алгоритмизация
Искусственный
интеллект
Распознавание
образов
Другие
дисциплины
Статистика
• Базируется больше на
теории
•Более сосредоточено на
проверке гипотез
Машинное обучение
•Более эвристично
•Концентрируется на
улучшении работы
агентов обучения
Data Mining
•Интеграция теории и
эвристик
•Единый процесс
анализа данных,
включает
очистку данных,
обучение, интеграцию и
визуализацию
Возникновение и развитие Data Mining обусловлено различными
факторами, основными среди которых являются следующие:
•совершенствование аппаратного и
программного обеспечения;
•совершенствование технологий
хранения и записи данных;
•накопление большого количества
ретроспективных данных;
•совершенствование алгоритмов
обработки информации.
Суть и цель технологии Data
Mining можно охарактеризовать так:
это технология, которая
предназначена для поиска в больших
объемах данных неочевидных,
объективных и полезных на
практике закономерностей.
Data Mining - это процесс обнаружения в сырых данных ранее
неизвестных, нетривиальных, практически полезных и
доступных интерпретации знаний, необходимых для принятия
решений в различных сферах человеческой деятельности.
Неочевидных - это значит, что
найденные закономерности не
обнаруживаются стандартными
методами обработки информации или
экспертным путем.
Объективных - это значит, что
обнаруженные закономерности бу
дут полностью соответствовать
действительности, в отличие от
всегда субъективного экспертного
мнения
Практически полезных - это
значит, что выводы имеют
конкретное значение, которому
можно найти практическое
применение.
Знания -
совокупность
сведений, которая
образует целостное
описание,
соответствующее
некоторому уровню
осведомленности об
описываемом
вопросе, предмете,
проблеме и т.д.
Использование знаний -
действительное применение
найденных знаний для
достижения конкретных
преимуществ.
В основу технологии Data
Mining положена
концепция шаблонов (patterns),
которые представляют собой
закономерности, свойственные
подвыборкам данных, кои могут
быть выражены в форме, понятной
человеку.
"Mining" по-
английски
означает "добыча
полезных
ископаемых", а
поиск закономерн
остей в огромном
количестве
данных действите
льно сродни
этому процессу.
Цель
поиска закономер
ностей -
представление да
нных в виде,
отражающем
искомые
процессы.
Агентство Gartner Group, занимающееся
анализом рынков IT, в 1980-х ввело
термин "Business Intelligence" (BI), деловой
интеллект или бизнес-интеллект.
Этот термин предложен для описания
различных концепций и методов, которые
улучшают бизнес решения путем
использования систем поддержки
принятия решений.
Классификация
аналитических
систем
Понятие BI объединяет
в себе различные
средства и технологии
анализа и
обработки данных масш
таба предприятия. На
основе этих средств
создаются BI-системы,
цель которых -
повысить качество
информации для
принятия
управленческих
решений.
BI-системы также
известны под
названием Систем
Поддержки Принятия
Решений (СППР, DSS,
Decision Support
System). Эти системы
превращают данные в
информацию, на
основе которой можно
принимать решения,
т.е. поддерживающую
принятие решений.
Gartner Group определяет состав рынка систем Business
Intelligence как набор программных продуктов следующих
классов: •информационно-
аналитические
системы (Enterprise
Information Systems, EIS);
•средства
интеллектуального
анализа данных (data
mining);
•инструменты для
выполнения запросов и
построения отчетов
(query and reporting tools).
•средства
построения
хранилищ данных (da
ta warehousing, ХД);
•системы
оперативной
аналитической
обработки (OLAP);
Классификация Gartner
базируется на методе
функциональных задач,
где программные
продукты каждого класса
выполняют
определенный набор
функций или операций с
использованием
специальных
технологий.
Перспективы технологии Data Mining
Потенциал Data Mining дает "зеленый свет" для расширения границ применения
технологии. Относительно перспектив Data Mining возможны следующие направлени
развития:
выделение типов
предметных областей с
соответствующими им
эвристиками, их
формализация
создание
формальных
языков и
логических
средств их
автоматизация
для
формализации
рассуждений
преодоление
существенного отставания
возможностей
инструментальных
средств Data Mining от
теоретических достижений
создание методов Data
Mining, способных не
только извлекать
из данных закономернос
ти, но и формировать
некие теории,
опирающиеся на
эмпирические данные
В долгосрочной перспективе будущее Data
Mining является действительно
захватывающим - это может быть поиск
интеллектуальными агентами как новых
видов лечения различных заболеваний, так и
нового понимания природы вселенной.
Если рассматривать будущее Data Mining в краткосрочной перспективе,
то очевидно, что развитие этой технологии наиболее направлено к
областям, связанным с бизнесом.
В краткосрочной перспективе
продукты Data Mining могут стать
такими же обычными и
необходимыми, как электронная
почта, и, например, использоваться
пользователями для поиска самых
низких цен на определенный товар
или наиболее дешевых билетов.
Однако Data Mining таит в себе и потенциальную опасность - ведь все большее
количество информации становится доступным через всемирную сеть, в том
числе и сведения частного характера, и все больше знаний возможно добыть из
нее:
Новая методика позволяет прогнозировать будущие запросы на основании
фактов покупок и делать выводы об их назначении. Цель данной методики -
получение как можно большего количества информации о клиентах, в том числе
и частного характера.
Не так давно крупнейший онлайновый
магазин "Amazon" оказался в центре
скандала по поводу полученного им
патента "Методы и системы помощи
пользователям при покупке товаров",
который представляет собой продукт Data
Mining, предназначенный для сбора
персональных данных о посетителях
магазина.
•требуют решений, основанных
на знаниях;
•имеют изменяющуюся окружающую
среду;
•имеют доступные, достаточные и
значимые данные;
•обеспечивают высокие дивиденды от
правильных решений.
Исследования отмечают, что существуют как успешные решения,
использующие Data Mining, так и неудачный опыт применения этой
технологии. Области, где применения технологии Data Mining, скорее
всего, будут успешными, имеют такие особенности:
Практическое применение.
Мне показалось интересным рассмотреть применение Data Mining на
примере сервиса вебинаров, интегрированных с социальными
сетями.
Но интеграция с
социальными
сетями открывает
как перед
пользователями,
так и перед
компаниями
многочисленные
новые
возможности,
усиливая тем
самым ранее
существовавшие.
Сама по себе идея
вебинара не является
новой. Сейчас в России
и заграницей
существуют уже
сформировавшиеся
рынки компаний,
предоставляющих
подобный сервис.
На сегодняшний день
более 10 000 компаний
заводят свои профайлы на
Facebook.com. Такая
популярность объясняется
тем, что пользователи все
больше привыкают к
использованию социальных
сетей в качестве
своеобразного портала с
множеством возможностей,
покрывающих практически
все потребности.
Интеграция с вебинарами
является отражением этой
наиболее сильной
тенденции.
На данный момент сервисы
вебинаров,
интегрированные с
социальными сетями,
отсутствуют.
Задачи, решаемые c
помощью Data Mining
1. Классификация аудитории
и контента
2. Кластеризация
3. Сокращение описания
4. Ассоциация
5. Прогнозирование
6. Анализ отклонений
7. Визуализация.
Заключение
В условиях увеличения активности Интернет-пользователей компаниям
необходимо кардинально менять свои стратегии развития, особенно связанные с
маркетингом. Для определения лучшего курса развития аналитики должны
обрабатывать огромное количество информации, что является очень
трудозатратным и малоэффективным процессом.
Использование технологии Data
Mining позволит значительно
сократить временные и денежные
затраты на выполнение этого
процесса, а также значительно
повысить это эффективность.
Это приведет к гораздо лучшему
осознанию потребностей клиентов,
в том числе потенциальных
пользователей, и приведет к
успешному развитию компании как в
плане интенсивного, так и за счет
экстенсивного роста
Спасибо за внимание!

Mais conteúdo relacionado

Mais procurados

Чем отличаются BI и Big Data?
Чем отличаются BI и Big Data?Чем отличаются BI и Big Data?
Чем отличаются BI и Big Data?Michael Kozloff
 
ATK QlikView Forum: QlikView в Gfk Rus
ATK QlikView Forum: QlikView в Gfk RusATK QlikView Forum: QlikView в Gfk Rus
ATK QlikView Forum: QlikView в Gfk RusMarina Payvina
 
модели метаданных
модели метаданныхмодели метаданных
модели метаданныхasheg
 
тема 5 2
тема 5 2тема 5 2
тема 5 2asheg
 
Больше DMP, хороших и разных
Больше DMP, хороших и разныхБольше DMP, хороших и разных
Больше DMP, хороших и разныхHybridRussia
 
Подходы к построению хранилищ данных в крупных организациях
Подходы к построению хранилищ данных в крупных организацияхПодходы к построению хранилищ данных в крупных организациях
Подходы к построению хранилищ данных в крупных организацияхСбертех | SberTech
 
Продвинутый анализ и машинное обучение с помощью виртуализации данных
Продвинутый анализ и машинное обучение с помощью виртуализации данныхПродвинутый анализ и машинное обучение с помощью виртуализации данных
Продвинутый анализ и машинное обучение с помощью виртуализации данныхDenodo
 
Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...
Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...
Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...Банковское обозрение
 
От больших данных к знаниям: преимущества для операторов связи
От больших данных к знаниям: преимущества для операторов связиОт больших данных к знаниям: преимущества для операторов связи
От больших данных к знаниям: преимущества для операторов связиElizaveta Alekseeva
 
Новая жизнь Ваших даных с PowerBI
Новая жизнь Ваших даных с PowerBI Новая жизнь Ваших даных с PowerBI
Новая жизнь Ваших даных с PowerBI Marina Payvina
 
Опыт эффективной организации интеллектуального архива
Опыт эффективной организации интеллектуального архиваОпыт эффективной организации интеллектуального архива
Опыт эффективной организации интеллектуального архиваSergey Poltev
 
От Больших данных к знаниям: преимущества для операторов связи
От Больших данных  к знаниям: преимущества  для операторов связиОт Больших данных  к знаниям: преимущества  для операторов связи
От Больших данных к знаниям: преимущества для операторов связиYuri Yashkin
 
SAP on Big Data Russia
SAP on Big Data RussiaSAP on Big Data Russia
SAP on Big Data Russiarusbase.vc
 
Oracle big data for finance
Oracle big data for financeOracle big data for finance
Oracle big data for financeCleverDATA
 
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьBig Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьTechart Marketing Group
 
Clever data 1dmp_oracle_fors
Clever data 1dmp_oracle_forsClever data 1dmp_oracle_fors
Clever data 1dmp_oracle_forsCleverDATA
 
Применение Big Data в маркетинге
Применение Big Data в маркетингеПрименение Big Data в маркетинге
Применение Big Data в маркетингеEvgeniy Pavlovskiy
 
StoredIQ - управление контентом
StoredIQ - управление контентомStoredIQ - управление контентом
StoredIQ - управление контентомSergey Yakimchuk
 

Mais procurados (20)

Чем отличаются BI и Big Data?
Чем отличаются BI и Big Data?Чем отличаются BI и Big Data?
Чем отличаются BI и Big Data?
 
ATK QlikView Forum: QlikView в Gfk Rus
ATK QlikView Forum: QlikView в Gfk RusATK QlikView Forum: QlikView в Gfk Rus
ATK QlikView Forum: QlikView в Gfk Rus
 
модели метаданных
модели метаданныхмодели метаданных
модели метаданных
 
тема 5 2
тема 5 2тема 5 2
тема 5 2
 
3 ibm bdw2015
3 ibm bdw20153 ibm bdw2015
3 ibm bdw2015
 
Больше DMP, хороших и разных
Больше DMP, хороших и разныхБольше DMP, хороших и разных
Больше DMP, хороших и разных
 
Подходы к построению хранилищ данных в крупных организациях
Подходы к построению хранилищ данных в крупных организацияхПодходы к построению хранилищ данных в крупных организациях
Подходы к построению хранилищ данных в крупных организациях
 
Продвинутый анализ и машинное обучение с помощью виртуализации данных
Продвинутый анализ и машинное обучение с помощью виртуализации данныхПродвинутый анализ и машинное обучение с помощью виртуализации данных
Продвинутый анализ и машинное обучение с помощью виртуализации данных
 
Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...
Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...
Презентация Никиты Шаблыкова с конференции «BIG DATA: банки, финансовые компа...
 
От больших данных к знаниям: преимущества для операторов связи
От больших данных к знаниям: преимущества для операторов связиОт больших данных к знаниям: преимущества для операторов связи
От больших данных к знаниям: преимущества для операторов связи
 
Новая жизнь Ваших даных с PowerBI
Новая жизнь Ваших даных с PowerBI Новая жизнь Ваших даных с PowerBI
Новая жизнь Ваших даных с PowerBI
 
Опыт эффективной организации интеллектуального архива
Опыт эффективной организации интеллектуального архиваОпыт эффективной организации интеллектуального архива
Опыт эффективной организации интеллектуального архива
 
От Больших данных к знаниям: преимущества для операторов связи
От Больших данных  к знаниям: преимущества  для операторов связиОт Больших данных  к знаниям: преимущества  для операторов связи
От Больших данных к знаниям: преимущества для операторов связи
 
SAP on Big Data Russia
SAP on Big Data RussiaSAP on Big Data Russia
SAP on Big Data Russia
 
Oracle big data for finance
Oracle big data for financeOracle big data for finance
Oracle big data for finance
 
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальностьBig Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
Big Data в маркетинге. Просто о непонятном: задачи, возможности, реальность
 
Clever data 1dmp_oracle_fors
Clever data 1dmp_oracle_forsClever data 1dmp_oracle_fors
Clever data 1dmp_oracle_fors
 
Применение Big Data в маркетинге
Применение Big Data в маркетингеПрименение Big Data в маркетинге
Применение Big Data в маркетинге
 
Big data, Clouds & HPC
Big data, Clouds & HPCBig data, Clouds & HPC
Big data, Clouds & HPC
 
StoredIQ - управление контентом
StoredIQ - управление контентомStoredIQ - управление контентом
StoredIQ - управление контентом
 

Destaque

Подход к решению data mining задач
Подход к решению data mining задачПодход к решению data mining задач
Подход к решению data mining задачhusniyarova
 
( Big ) Data Management - Data Mining and Machine Learning - Global concepts ...
( Big ) Data Management - Data Mining and Machine Learning - Global concepts ...( Big ) Data Management - Data Mining and Machine Learning - Global concepts ...
( Big ) Data Management - Data Mining and Machine Learning - Global concepts ...Nicolas Sarramagna
 
Data mining в реальном проекте
Data mining в реальном проектеData mining в реальном проекте
Data mining в реальном проектеAlexander Byndyu
 
Петрова Ксения - Data mining на практике - dmlabs.org
Петрова Ксения - Data mining на практике - dmlabs.orgПетрова Ксения - Data mining на практике - dmlabs.org
Петрова Ксения - Data mining на практике - dmlabs.orgWG_ Events
 
Гринчук Александр - Практическое применение Data mining технологий-ооо «нанот...
Гринчук Александр - Практическое применение Data mining технологий-ооо «нанот...Гринчук Александр - Практическое применение Data mining технологий-ооо «нанот...
Гринчук Александр - Практическое применение Data mining технологий-ооо «нанот...WG_ Events
 
Programas de-php-realizados en clase
Programas de-php-realizados en claseProgramas de-php-realizados en clase
Programas de-php-realizados en claseNoé Arpasi
 
Hi 07-programa de php que registra datos en my sql
Hi 07-programa de php que registra datos en my sqlHi 07-programa de php que registra datos en my sql
Hi 07-programa de php que registra datos en my sqlNoé Arpasi
 
Monitoring sociálních médií ve firemní praxi - WebTop100
Monitoring sociálních médií ve firemní praxi - WebTop100Monitoring sociálních médií ve firemní praxi - WebTop100
Monitoring sociálních médií ve firemní praxi - WebTop100Ondřej Jireš
 
Obchod s hloupostí na Facebooku
Obchod s hloupostí na FacebookuObchod s hloupostí na Facebooku
Obchod s hloupostí na FacebookuOndřej Jireš
 
Лекция №1 "Задачи Data Mining"
Лекция №1 "Задачи Data Mining" Лекция №1 "Задачи Data Mining"
Лекция №1 "Задачи Data Mining" Technosphere1
 
Eurozone crisis: A peek into the sovereign debt crisis
Eurozone crisis: A peek into the sovereign debt crisis Eurozone crisis: A peek into the sovereign debt crisis
Eurozone crisis: A peek into the sovereign debt crisis Ibadat Singh
 
Black box customer v3
Black box customer v3Black box customer v3
Black box customer v3mlinaker
 
Data Mining - lecture 1 - 2014
Data Mining - lecture 1 - 2014Data Mining - lecture 1 - 2014
Data Mining - lecture 1 - 2014Andrii Gakhov
 
Challenges to new product development file
Challenges to new product development fileChallenges to new product development file
Challenges to new product development fileIbadat Singh
 
Data Mining - lecture 2 - 2014
Data Mining - lecture 2 - 2014Data Mining - lecture 2 - 2014
Data Mining - lecture 2 - 2014Andrii Gakhov
 

Destaque (20)

Подход к решению data mining задач
Подход к решению data mining задачПодход к решению data mining задач
Подход к решению data mining задач
 
ІАД
ІАДІАД
ІАД
 
( Big ) Data Management - Data Mining and Machine Learning - Global concepts ...
( Big ) Data Management - Data Mining and Machine Learning - Global concepts ...( Big ) Data Management - Data Mining and Machine Learning - Global concepts ...
( Big ) Data Management - Data Mining and Machine Learning - Global concepts ...
 
Data mining
Data mining Data mining
Data mining
 
Data mining в реальном проекте
Data mining в реальном проектеData mining в реальном проекте
Data mining в реальном проекте
 
Петрова Ксения - Data mining на практике - dmlabs.org
Петрова Ксения - Data mining на практике - dmlabs.orgПетрова Ксения - Data mining на практике - dmlabs.org
Петрова Ксения - Data mining на практике - dmlabs.org
 
Гринчук Александр - Практическое применение Data mining технологий-ооо «нанот...
Гринчук Александр - Практическое применение Data mining технологий-ооо «нанот...Гринчук Александр - Практическое применение Data mining технологий-ооо «нанот...
Гринчук Александр - Практическое применение Data mining технологий-ооо «нанот...
 
Programas de-php-realizados en clase
Programas de-php-realizados en claseProgramas de-php-realizados en clase
Programas de-php-realizados en clase
 
To the door
To the doorTo the door
To the door
 
Hi 07-programa de php que registra datos en my sql
Hi 07-programa de php que registra datos en my sqlHi 07-programa de php que registra datos en my sql
Hi 07-programa de php que registra datos en my sql
 
Monitoring sociálních médií ve firemní praxi - WebTop100
Monitoring sociálních médií ve firemní praxi - WebTop100Monitoring sociálních médií ve firemní praxi - WebTop100
Monitoring sociálních médií ve firemní praxi - WebTop100
 
Obchod s hloupostí na Facebooku
Obchod s hloupostí na FacebookuObchod s hloupostí na Facebooku
Obchod s hloupostí na Facebooku
 
Stress mgt
Stress mgtStress mgt
Stress mgt
 
смирнов Data mining
смирнов Data miningсмирнов Data mining
смирнов Data mining
 
Лекция №1 "Задачи Data Mining"
Лекция №1 "Задачи Data Mining" Лекция №1 "Задачи Data Mining"
Лекция №1 "Задачи Data Mining"
 
Eurozone crisis: A peek into the sovereign debt crisis
Eurozone crisis: A peek into the sovereign debt crisis Eurozone crisis: A peek into the sovereign debt crisis
Eurozone crisis: A peek into the sovereign debt crisis
 
Black box customer v3
Black box customer v3Black box customer v3
Black box customer v3
 
Data Mining - lecture 1 - 2014
Data Mining - lecture 1 - 2014Data Mining - lecture 1 - 2014
Data Mining - lecture 1 - 2014
 
Challenges to new product development file
Challenges to new product development fileChallenges to new product development file
Challenges to new product development file
 
Data Mining - lecture 2 - 2014
Data Mining - lecture 2 - 2014Data Mining - lecture 2 - 2014
Data Mining - lecture 2 - 2014
 

Semelhante a Байдалина472(2)

Современные методы анализа данных
Современные методы анализа данныхСовременные методы анализа данных
Современные методы анализа данныхDEVTYPE
 
современные методы анализа данных для бизнеса в стиле Google(2)
современные методы анализа данных для бизнеса в стиле Google(2)современные методы анализа данных для бизнеса в стиле Google(2)
современные методы анализа данных для бизнеса в стиле Google(2)DataConsulting2013
 
Data Science Week 2016. Sberbank
Data Science Week 2016. SberbankData Science Week 2016. Sberbank
Data Science Week 2016. SberbankNewprolab
 
BIS DE
BIS DEBIS DE
BIS DEMag0s
 
Query hunter презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙ
Query hunter  презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙQuery hunter  презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙ
Query hunter презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙqueryhunter
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данныхYuri Yashkin
 
QueryHunter project overview for lenovo
QueryHunter   project overview  for lenovoQueryHunter   project overview  for lenovo
QueryHunter project overview for lenovoqueryhunter
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхElizaveta Alekseeva
 
ИТ-инфраструктура нового поколения
ИТ-инфраструктура нового поколенияИТ-инфраструктура нового поколения
ИТ-инфраструктура нового поколенияАльбина Минуллина
 
Персональные данные организации
Персональные данные организацииПерсональные данные организации
Персональные данные организацииAlexey Fedorischev
 
Прокачиваем информационные системы с помощью data science
Прокачиваем информационные системы с помощью data scienceПрокачиваем информационные системы с помощью data science
Прокачиваем информационные системы с помощью data scienceSQALab
 
Organizational knowledge in ISO 9001:2015
Organizational knowledge in ISO 9001:2015Organizational knowledge in ISO 9001:2015
Organizational knowledge in ISO 9001:2015Igor Zvyaghin
 
BigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBranchMarketing
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Evgeniy Pavlovskiy
 
Андрей Новиков RKM-2016 - Socialnaya analitika & Big Data
Андрей Новиков RKM-2016 - Socialnaya analitika & Big DataАндрей Новиков RKM-2016 - Socialnaya analitika & Big Data
Андрей Новиков RKM-2016 - Socialnaya analitika & Big Datavalveindustryhub
 
Data-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииData-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииAlexander Barakov
 
Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Marina Payvina
 
Защита баз данных в банке — проблемы и решения
Защита баз данных в банке — проблемы и решенияЗащита баз данных в банке — проблемы и решения
Защита баз данных в банке — проблемы и решенияОльга Антонова
 
Логическая витрина данных
Логическая витрина данныхЛогическая витрина данных
Логическая витрина данныхSergey Gorshkov
 

Semelhante a Байдалина472(2) (20)

Современные методы анализа данных
Современные методы анализа данныхСовременные методы анализа данных
Современные методы анализа данных
 
современные методы анализа данных для бизнеса в стиле Google(2)
современные методы анализа данных для бизнеса в стиле Google(2)современные методы анализа данных для бизнеса в стиле Google(2)
современные методы анализа данных для бизнеса в стиле Google(2)
 
Data Science Week 2016. Sberbank
Data Science Week 2016. SberbankData Science Week 2016. Sberbank
Data Science Week 2016. Sberbank
 
BIS DE
BIS DEBIS DE
BIS DE
 
Query hunter презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙ
Query hunter  презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙQuery hunter  презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙ
Query hunter презентация для КОНКУРСА РУССКИХ ИННОВАЦИЙ
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данных
 
QueryHunter project overview for lenovo
QueryHunter   project overview  for lenovoQueryHunter   project overview  for lenovo
QueryHunter project overview for lenovo
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данных
 
ИТ-инфраструктура нового поколения
ИТ-инфраструктура нового поколенияИТ-инфраструктура нового поколения
ИТ-инфраструктура нового поколения
 
SPSS Modeler
SPSS ModelerSPSS Modeler
SPSS Modeler
 
Персональные данные организации
Персональные данные организацииПерсональные данные организации
Персональные данные организации
 
Прокачиваем информационные системы с помощью data science
Прокачиваем информационные системы с помощью data scienceПрокачиваем информационные системы с помощью data science
Прокачиваем информационные системы с помощью data science
 
Organizational knowledge in ISO 9001:2015
Organizational knowledge in ISO 9001:2015Organizational knowledge in ISO 9001:2015
Organizational knowledge in ISO 9001:2015
 
BigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнеса
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии
 
Андрей Новиков RKM-2016 - Socialnaya analitika & Big Data
Андрей Новиков RKM-2016 - Socialnaya analitika & Big DataАндрей Новиков RKM-2016 - Socialnaya analitika & Big Data
Андрей Новиков RKM-2016 - Socialnaya analitika & Big Data
 
Data-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииData-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной Компании
 
Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?Большие данные и бизнес-аналитика: как найти пользу?
Большие данные и бизнес-аналитика: как найти пользу?
 
Защита баз данных в банке — проблемы и решения
Защита баз данных в банке — проблемы и решенияЗащита баз данных в банке — проблемы и решения
Защита баз данных в банке — проблемы и решения
 
Логическая витрина данных
Логическая витрина данныхЛогическая витрина данных
Логическая витрина данных
 

Байдалина472(2)

  • 1. Презентация по предмету Хранилища данных На тему Data mining Выполнила студентка Группы 472(2) Байдалина Любовь Москва 2010
  • 2. Термин Data Mining часто переводится как: • добыча данных •извлечение информации •раскопка данных •интеллектуальный анализ данных •средства поиска закономерностей •извлечение знаний •анализ шаблонов •раскопка знаний в базах данных •информационная проходка данных
  • 4. Статистика • Базируется больше на теории •Более сосредоточено на проверке гипотез Машинное обучение •Более эвристично •Концентрируется на улучшении работы агентов обучения Data Mining •Интеграция теории и эвристик •Единый процесс анализа данных, включает очистку данных, обучение, интеграцию и визуализацию
  • 5. Возникновение и развитие Data Mining обусловлено различными факторами, основными среди которых являются следующие: •совершенствование аппаратного и программного обеспечения; •совершенствование технологий хранения и записи данных; •накопление большого количества ретроспективных данных; •совершенствование алгоритмов обработки информации.
  • 6. Суть и цель технологии Data Mining можно охарактеризовать так: это технология, которая предназначена для поиска в больших объемах данных неочевидных, объективных и полезных на практике закономерностей. Data Mining - это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
  • 7. Неочевидных - это значит, что найденные закономерности не обнаруживаются стандартными методами обработки информации или экспертным путем. Объективных - это значит, что обнаруженные закономерности бу дут полностью соответствовать действительности, в отличие от всегда субъективного экспертного мнения Практически полезных - это значит, что выводы имеют конкретное значение, которому можно найти практическое применение. Знания - совокупность сведений, которая образует целостное описание, соответствующее некоторому уровню осведомленности об описываемом вопросе, предмете, проблеме и т.д. Использование знаний - действительное применение найденных знаний для достижения конкретных преимуществ.
  • 8. В основу технологии Data Mining положена концепция шаблонов (patterns), которые представляют собой закономерности, свойственные подвыборкам данных, кои могут быть выражены в форме, понятной человеку. "Mining" по- английски означает "добыча полезных ископаемых", а поиск закономерн остей в огромном количестве данных действите льно сродни этому процессу. Цель поиска закономер ностей - представление да нных в виде, отражающем искомые процессы.
  • 9. Агентство Gartner Group, занимающееся анализом рынков IT, в 1980-х ввело термин "Business Intelligence" (BI), деловой интеллект или бизнес-интеллект. Этот термин предложен для описания различных концепций и методов, которые улучшают бизнес решения путем использования систем поддержки принятия решений. Классификация аналитических систем
  • 10. Понятие BI объединяет в себе различные средства и технологии анализа и обработки данных масш таба предприятия. На основе этих средств создаются BI-системы, цель которых - повысить качество информации для принятия управленческих решений. BI-системы также известны под названием Систем Поддержки Принятия Решений (СППР, DSS, Decision Support System). Эти системы превращают данные в информацию, на основе которой можно принимать решения, т.е. поддерживающую принятие решений.
  • 11. Gartner Group определяет состав рынка систем Business Intelligence как набор программных продуктов следующих классов: •информационно- аналитические системы (Enterprise Information Systems, EIS); •средства интеллектуального анализа данных (data mining); •инструменты для выполнения запросов и построения отчетов (query and reporting tools). •средства построения хранилищ данных (da ta warehousing, ХД); •системы оперативной аналитической обработки (OLAP);
  • 12. Классификация Gartner базируется на методе функциональных задач, где программные продукты каждого класса выполняют определенный набор функций или операций с использованием специальных технологий.
  • 13. Перспективы технологии Data Mining Потенциал Data Mining дает "зеленый свет" для расширения границ применения технологии. Относительно перспектив Data Mining возможны следующие направлени развития: выделение типов предметных областей с соответствующими им эвристиками, их формализация создание формальных языков и логических средств их автоматизация для формализации рассуждений преодоление существенного отставания возможностей инструментальных средств Data Mining от теоретических достижений создание методов Data Mining, способных не только извлекать из данных закономернос ти, но и формировать некие теории, опирающиеся на эмпирические данные
  • 14. В долгосрочной перспективе будущее Data Mining является действительно захватывающим - это может быть поиск интеллектуальными агентами как новых видов лечения различных заболеваний, так и нового понимания природы вселенной. Если рассматривать будущее Data Mining в краткосрочной перспективе, то очевидно, что развитие этой технологии наиболее направлено к областям, связанным с бизнесом. В краткосрочной перспективе продукты Data Mining могут стать такими же обычными и необходимыми, как электронная почта, и, например, использоваться пользователями для поиска самых низких цен на определенный товар или наиболее дешевых билетов.
  • 15. Однако Data Mining таит в себе и потенциальную опасность - ведь все большее количество информации становится доступным через всемирную сеть, в том числе и сведения частного характера, и все больше знаний возможно добыть из нее: Новая методика позволяет прогнозировать будущие запросы на основании фактов покупок и делать выводы об их назначении. Цель данной методики - получение как можно большего количества информации о клиентах, в том числе и частного характера. Не так давно крупнейший онлайновый магазин "Amazon" оказался в центре скандала по поводу полученного им патента "Методы и системы помощи пользователям при покупке товаров", который представляет собой продукт Data Mining, предназначенный для сбора персональных данных о посетителях магазина.
  • 16. •требуют решений, основанных на знаниях; •имеют изменяющуюся окружающую среду; •имеют доступные, достаточные и значимые данные; •обеспечивают высокие дивиденды от правильных решений. Исследования отмечают, что существуют как успешные решения, использующие Data Mining, так и неудачный опыт применения этой технологии. Области, где применения технологии Data Mining, скорее всего, будут успешными, имеют такие особенности:
  • 17. Практическое применение. Мне показалось интересным рассмотреть применение Data Mining на примере сервиса вебинаров, интегрированных с социальными сетями. Но интеграция с социальными сетями открывает как перед пользователями, так и перед компаниями многочисленные новые возможности, усиливая тем самым ранее существовавшие. Сама по себе идея вебинара не является новой. Сейчас в России и заграницей существуют уже сформировавшиеся рынки компаний, предоставляющих подобный сервис.
  • 18. На сегодняшний день более 10 000 компаний заводят свои профайлы на Facebook.com. Такая популярность объясняется тем, что пользователи все больше привыкают к использованию социальных сетей в качестве своеобразного портала с множеством возможностей, покрывающих практически все потребности. Интеграция с вебинарами является отражением этой наиболее сильной тенденции. На данный момент сервисы вебинаров, интегрированные с социальными сетями, отсутствуют.
  • 19. Задачи, решаемые c помощью Data Mining 1. Классификация аудитории и контента 2. Кластеризация 3. Сокращение описания 4. Ассоциация 5. Прогнозирование 6. Анализ отклонений 7. Визуализация.
  • 20.
  • 21. Заключение В условиях увеличения активности Интернет-пользователей компаниям необходимо кардинально менять свои стратегии развития, особенно связанные с маркетингом. Для определения лучшего курса развития аналитики должны обрабатывать огромное количество информации, что является очень трудозатратным и малоэффективным процессом. Использование технологии Data Mining позволит значительно сократить временные и денежные затраты на выполнение этого процесса, а также значительно повысить это эффективность. Это приведет к гораздо лучшему осознанию потребностей клиентов, в том числе потенциальных пользователей, и приведет к успешному развитию компании как в плане интенсивного, так и за счет экстенсивного роста