SlideShare uma empresa Scribd logo
1 de 16
Datamining – что это?




               Сергей Орешков
               Аспирант БФУ им. И. Канта
Немного истории
Первый жесткий диск
Датамайнинг
Knowledge Discovery in Databases
• Математическая статистика
• Алгоритмы машинного обучения
• Большие объемы данных
Применения датамайнинга:
•   Бизнес
•   Наука(CERN, например)
•   Медицина
•   Системы поддержки принятия решений
•   Еще много разных применений…
Бизнес применение
• Любой современный бизнес порождает огромное
  количество информации, содержащей в себе знания
• Если информацию правильно обработать или даже просто
  представить, можно узнать о своей компании много
  крайне интересных вещей и даже принять какие-то
  важные решения
Научное применение
Там, где проводят эксперименты, всегда много данных,
которые надо обработать и слишком мало людей, которые
разбираются в данных.
Процесс датамайнинга
•   Выбор данных
•   Препроцессинг(подготовка данных)
•   Датамайнинг
•   Проверка
•   Интерпретация/использование
Виды датамайнинга
Виды задач, которые обычно связывают с понятиями
датамайнинга и KDD:
 • Выявление аномалий.
 • Поиск внутренних зависимостей.
 • Кластеризация.
 • Классификация.
 • Статистика, OLAP.
Выявление аномалий
Нахождение необычных записей - ошибок, чего-то
необычного, того, что может потребовать расследования.
Поиск внутренних зависимостей
Вероятностый анализ данных и нахождение корреляций.
Кластеризация
Разбиение набора данных на группы
Классификация
Определение принадлежности новых данных по уже
имеющимся.
Пример удачной
классификации
Пример не очень удачной
классификации
Datamining – что это?

Mais conteúdo relacionado

Destaque

Разработка мобильных приложений на BitrixMobile 2.0
Разработка мобильных приложений на BitrixMobile 2.0Разработка мобильных приложений на BitrixMobile 2.0
Разработка мобильных приложений на BitrixMobile 2.0
ForkConf
 
Олег Антонян. Квантовые компьютеры и квантовая механика
Олег Антонян. Квантовые компьютеры и квантовая механикаОлег Антонян. Квантовые компьютеры и квантовая механика
Олег Антонян. Квантовые компьютеры и квантовая механика
ForkConf
 
Александр Белов. Основы управления распределенными программными проектами на ...
Александр Белов. Основы управления распределенными программными проектами на ...Александр Белов. Основы управления распределенными программными проектами на ...
Александр Белов. Основы управления распределенными программными проектами на ...
ForkConf
 
Алексей Барбашин. Лояльная модификация типовой конфигурации 1С.
Алексей Барбашин. Лояльная модификация типовой конфигурации 1С.Алексей Барбашин. Лояльная модификация типовой конфигурации 1С.
Алексей Барбашин. Лояльная модификация типовой конфигурации 1С.
ForkConf
 
how to_make_games Михайлов Антон
how to_make_games Михайлов Антонhow to_make_games Михайлов Антон
how to_make_games Михайлов Антон
ForkConf
 

Destaque (11)

Разработка мобильных приложений на BitrixMobile 2.0
Разработка мобильных приложений на BitrixMobile 2.0Разработка мобильных приложений на BitrixMobile 2.0
Разработка мобильных приложений на BitrixMobile 2.0
 
Олег Антонян. Квантовые компьютеры и квантовая механика
Олег Антонян. Квантовые компьютеры и квантовая механикаОлег Антонян. Квантовые компьютеры и квантовая механика
Олег Антонян. Квантовые компьютеры и квантовая механика
 
Анатолий Федченко "Бояться глупо..."
Анатолий Федченко "Бояться глупо..."Анатолий Федченко "Бояться глупо..."
Анатолий Федченко "Бояться глупо..."
 
Александр Белов. Основы управления распределенными программными проектами на ...
Александр Белов. Основы управления распределенными программными проектами на ...Александр Белов. Основы управления распределенными программными проектами на ...
Александр Белов. Основы управления распределенными программными проектами на ...
 
Олег Антонян
Олег АнтонянОлег Антонян
Олег Антонян
 
Михаил Кузьмин. Рынок мобильных приложений и игр.
Михаил Кузьмин.  Рынок мобильных приложений и игр.Михаил Кузьмин.  Рынок мобильных приложений и игр.
Михаил Кузьмин. Рынок мобильных приложений и игр.
 
Владимир Гордеев
Владимир ГордеевВладимир Гордеев
Владимир Гордеев
 
Алексей Барбашин. Лояльная модификация типовой конфигурации 1С.
Алексей Барбашин. Лояльная модификация типовой конфигурации 1С.Алексей Барбашин. Лояльная модификация типовой конфигурации 1С.
Алексей Барбашин. Лояльная модификация типовой конфигурации 1С.
 
how to_make_games Михайлов Антон
how to_make_games Михайлов Антонhow to_make_games Михайлов Антон
how to_make_games Михайлов Антон
 
Юнит тестирование, Александр Прукс, 30 Марта 2014
Юнит тестирование, Александр Прукс, 30 Марта 2014Юнит тестирование, Александр Прукс, 30 Марта 2014
Юнит тестирование, Александр Прукс, 30 Марта 2014
 
Серверная архитектура высоконагруженных веб-приложений
Серверная архитектура высоконагруженных веб-приложений	Серверная архитектура высоконагруженных веб-приложений
Серверная архитектура высоконагруженных веб-приложений
 

Semelhante a Datamining – что это?

Современные методы анализа данных
Современные методы анализа данныхСовременные методы анализа данных
Современные методы анализа данных
DEVTYPE
 
Продвинутый анализ и машинное обучение с помощью виртуализации данных
Продвинутый анализ и машинное обучение с помощью виртуализации данныхПродвинутый анализ и машинное обучение с помощью виртуализации данных
Продвинутый анализ и машинное обучение с помощью виртуализации данных
Denodo
 
Flexicapture Archive
Flexicapture ArchiveFlexicapture Archive
Flexicapture Archive
EOS-soft
 
нил тбд нтс_10-13
нил тбд нтс_10-13нил тбд нтс_10-13
нил тбд нтс_10-13
Vladimir Krylov
 

Semelhante a Datamining – что это? (20)

Байдалина472(2)
Байдалина472(2)Байдалина472(2)
Байдалина472(2)
 
Прокачиваем информационные системы с помощью data science
Прокачиваем информационные системы с помощью data scienceПрокачиваем информационные системы с помощью data science
Прокачиваем информационные системы с помощью data science
 
Современные методы анализа данных
Современные методы анализа данныхСовременные методы анализа данных
Современные методы анализа данных
 
Искусственный интеллект и Big Data в бизнесе
Искусственный интеллект и Big Data в бизнесеИскусственный интеллект и Big Data в бизнесе
Искусственный интеллект и Big Data в бизнесе
 
Тренды сегодня: Big Data
Тренды сегодня: Big DataТренды сегодня: Big Data
Тренды сегодня: Big Data
 
Data Science Week 2016. Sberbank
Data Science Week 2016. SberbankData Science Week 2016. Sberbank
Data Science Week 2016. Sberbank
 
!Predictive analyticbasics part1
!Predictive analyticbasics part1!Predictive analyticbasics part1
!Predictive analyticbasics part1
 
2015 06-16 круглый стол компетенции по большим данным
2015 06-16 круглый стол компетенции по большим данным2015 06-16 круглый стол компетенции по большим данным
2015 06-16 круглый стол компетенции по большим данным
 
Продвинутый анализ и машинное обучение с помощью виртуализации данных
Продвинутый анализ и машинное обучение с помощью виртуализации данныхПродвинутый анализ и машинное обучение с помощью виртуализации данных
Продвинутый анализ и машинное обучение с помощью виртуализации данных
 
Подготовка специалистов по анализу больших данных: все аспекты
Подготовка специалистов по анализу больших данных: все аспектыПодготовка специалистов по анализу больших данных: все аспекты
Подготовка специалистов по анализу больших данных: все аспекты
 
Data Mining - lecture 1 - 2014
Data Mining - lecture 1 - 2014Data Mining - lecture 1 - 2014
Data Mining - lecture 1 - 2014
 
смирнов Data mining
смирнов Data miningсмирнов Data mining
смирнов Data mining
 
Big data и bi в медицине 5 волна
Big data и bi в медицине 5 волнаBig data и bi в медицине 5 волна
Big data и bi в медицине 5 волна
 
Infosec Research Group
Infosec Research GroupInfosec Research Group
Infosec Research Group
 
38 - Базы данных. Общее понятие BigData
38 - Базы данных. Общее понятие BigData38 - Базы данных. Общее понятие BigData
38 - Базы данных. Общее понятие BigData
 
Игорь Василевский «Управление маркетинговыми знаниями. Рост интеллектуального...
Игорь Василевский «Управление маркетинговыми знаниями. Рост интеллектуального...Игорь Василевский «Управление маркетинговыми знаниями. Рост интеллектуального...
Игорь Василевский «Управление маркетинговыми знаниями. Рост интеллектуального...
 
Microsoft BigData event @ Bibliotech
Microsoft BigData event @ BibliotechMicrosoft BigData event @ Bibliotech
Microsoft BigData event @ Bibliotech
 
Flexicapture Archive
Flexicapture ArchiveFlexicapture Archive
Flexicapture Archive
 
Опыт эффективной организации интеллектуального архива
Опыт эффективной организации интеллектуального архиваОпыт эффективной организации интеллектуального архива
Опыт эффективной организации интеллектуального архива
 
нил тбд нтс_10-13
нил тбд нтс_10-13нил тбд нтс_10-13
нил тбд нтс_10-13
 

Datamining – что это?

Notas do Editor

  1. Люди(Человечество) накапливает информацию веками.Зачем оно это делает? Сама по себе информация не является ценностью – ценностью является то знание, которое она в себе содерждит. Информация содержит в себе знание.Знания люди используют для:Принятие решений.Опыт.Довольно долгое время у человечества всё было плохо с накоплением и хранением информации.Накопление большого количества информации затребовало методов её обработки – так появилась математическая статистика.
  2. Ситуация начала меняться с появлением систем, которые могли бы ХРАНИТЬ И ОБРАБАТЫВАТЬ информациюПоявились базы данных.Вот тут статистика встретилась с алгоритмами.Внезапно узнать среднюю температуру по больнице стало возможным не за пару дней(перебирая амбулаторные карты больных), а за пару секунд(сделав SELECT AVG(t))
  3. Поле пересечения компьютер-сайнс и статистики, процесс нахождения шаблонов в больших наборах данныхДатамайнинг использует техники из разделов искуственного интеллекта, машинного обучения, статистики и баз данных.Общая цель процесса датамайнинга - получить информацию из набора данных и преобразовать её в понятный вид для последующего использования.Помимо непосредственной аналитики используются такие вещи, как препроцессинг данных(подготовка) и визуализация.В жизни датамайнинг - это полностью автоматический или управляемый анализ большого количества данных с разными целями - извлечение прежде неизвестных интересных шаблонов, аномальных записей, зависимостей.
  4. Мы с вами обязательно коснемся всех этих разделов.
  5. Применения:Выявление мошеннических транзакцийВыявление интересных с научной точки зрения объектовВыявление ошибок
  6. Основано на вероятностном анализе.«Рекомендательные системы»«Купите еще и это»
  7. Разбиение товаров на группыАнализ социальных сетей – выявление сообществРаспределение процессов в многопоточных системах
  8. That’s all, folks!