데이터마이닝의 개요

Chris Kim
Chris KimWriter / Game Designer / Tech Journalist em YK IDEA SCHOOL
데이터마이닝의 개요
                          김인권
                    ingunbi@gmail.com




12년 11월 14일 수요일
데이터마이닝은 데이터베이스, 데이터 웨어하우스 또는 다른
 정보 저장소에 저장된 방대한 양의 데이터로부터 흥미로운 패
           턴을 발견하는 작업이다.




12년 11월 14일 수요일
데이터마이닝의 도입배경




12년 11월 14일 수요일
정보와 데이터

   •     수년 전 부터 여러 분야에 정보라는 단어와 결합

   •     인터넷을 비롯한 컴퓨터의 발전은 데이터 베이스를 포한하여 정보
         를 다루는 기술이 폭발적으로 발전

   •     스마트폰과 소셜 네트워크로 더욱 자유롭게 정보의 생산과 공유, 전
         파가 가능

   •     유용한 정보를 캐내는 ‘데이터마이닝’이 주목받기 시작



12년 11월 14일 수요일
다차원 데이터 분석


   •     대용량의 데이터는 관측값의 수와 데이터의 차원(속성 또는 변수)이
         크다.

   •     전통적인 통계학에서의 분석방법으로는 한계 노출

   •     다차원의 데이터에 적합한 새로운 분석방법 마련이 필요




12년 11월 14일 수요일
정보처리기술의 발전

   •     정보를 적절히 처리하는 기술이 필요

   •     1980년대 하드웨어 발전으로 대용량 데이터 저장 및 처리 가능

   •     1990년대 인터넷 관련 기술의 발전과 더불어 실시간 의사결정시스
         템 가능. 데이터웨어하우징 기술의 발달

   •     21세기에는 소셜 네트워크에서 관계분석 및 텍스트마이닝 등으로
         활용 분야 확장




12년 11월 14일 수요일
고객관계관리의 도입


   •     기업의 전통적인 자원을 효과적으로 관리 및 운영해야 한다.

   •     새로운 제품과 서비스를 창출해 내는 또 다른 자원도 관리해야 한다.

   •     기업의 생존과 발전을 하기위해서는 고객의 요구를 파악해야한다.

   •     데이터마이닝이 크게 활성화된 동기는 고객정보를 축적 및 사용하
         는 고객관계관리(CRM)를 도입하면서부터이다.




12년 11월 14일 수요일
데이터마이닝의 개념




12년 11월 14일 수요일
데이터마이닝의 정의
                                                    팅
                                                  컴퓨
                                                뉴로
                    통계학      패턴인식

                                  기계학습   인공지능

                       데이터마이닝


                  데이터베이스
                           지식발견




    •     다량의 가공하지 않은 데이터로부터 소량의 귀중한 덩어리를 찾아
          내는 과정

    •     발굴된 값진 정보를 사용자가 전문적인 지식 없이 사용할 수 있도록
          제공하는 시스템 개발과정까지 포함하기도 한다.

12년 11월 14일 수요일
데이터마이닝과 OLAP의 차이점


   •     데이터마이닝은 예측가능한 정보의 추출을 시행한다.

   •     OLAP는 TOP-DOWN 방식으로 효율적인 의사 결정에 도움을 주
         도록 한다.

   •     데이터마이닝은 DOWN-TOP 방식으로 영향을 미치는 인자들이
         무엇인지 탐사하는데 도움을 준다.




12년 11월 14일 수요일
데이터마이닝 과정
                   분석       계획     탐색


                           DELPA

                   처리       표현     탐색


   •     계획 - 문제제기

   •     탐색 - 데이터의 특성 찾기

   •     표현 - 비주얼적으로 특성을 표현

   •     처리 & 분석
12년 11월 14일 수요일
데이터마이닝의 특징
                         특징                             비고

                                        - 시간의 흐름에 따라 축적됨
           대용량의 관측 가능한 자료
                                        - 데이터 분석을 업무에 두지 않는 경우가 많음
                   컴퓨터 집약적 기법
                                        - 컴퓨터의 강력한 처리속도와 능력 활용
                  (computer-intensive
                                        - 기존 분석기법의 한계 극복
                      method)
             경험적 방법(adhockery           - 경험에 기초하여 기법 개발
                 method)                - 수리적 특성이 규명되지 않는 기법도 존재

             일반화(generalization)        - 일반화는 새로운 데이터에 얼마나 잘 적용되는가를 의미

                  업무활용성(business
                                        - 다양한 경영상황하에서 경쟁력 확보를 위한 의사결정을 지원
                    aplications)


12년 11월 14일 수요일
데이터마이닝 관련 분야




12년 11월 14일 수요일
연구분야
                  분야                           세부설명


                              - 데이터마이닝과 가장 유사한 의미
     KDD(knowledge discoverty - 지식을 추출하는 전 과정
           in database)       - 데이터마이닝은 OLAP이나 웨어하우징 등과 마찬가지로 전체적인
                              KDD 과정 중 한 과정인 탐사 단계를 의미

      기계학습(machine learning) - 인공지능의 한 분야로 자동적인 학습기법을 설계하고 구현하는 분야


            패턴인식(pattern      - 공학에서 출발하였으며, 이미지 분류와 깊은 관련이 잇음
             recognition)     - 데이터베이스에서 유용한 패턴을 찾아내는 다양한 기법을 제공


              뉴로컴퓨팅
                              - 신경망 등과 관련된 학문적 배경을 가짐
           (neurocomputing)
            통계학(statistics)   - 데이터마이닝은 대부분 통계학의 한 분야라고 할 수 있다


12년 11월 14일 수요일
활용분야
         • 고객관계관리      • 생명정보학
         • 신용평가        • ETC......
         • 품질개선
         • 부정행위 적발
         • 이미지분석


12년 11월 14일 수요일
데이터마이닝 기법




12년 11월 14일 수요일
연관성 분석



   •     주어진 데이터의 집합에서 함께 빈번하게 발생하는 속성에 대한 조
         건을 나타내는 연관규칙을 발견하는 것

   •     장바구니 분석, 트랜젝션 분석에 사용




12년 11월 14일 수요일
분류와 예측


   •     목표범주를 설명하고, 구별하는 모형의 집합을 찾는 과정

   •     새로운 객체가 관측 되었을 때, 이를 적절한 목표범주에 할당할 수
         있도록 분류모형을 구축하는 것이 목적.

   •     판별분류규칙, 의사결정나무, 폴리클래스, 신경망 등등

   •     관련성 분석을 선행하여 효과적인 예측모형을 구축한다.




12년 11월 14일 수요일
군집분석


   •     이미 알려진 범주값을 참고하지 않고 데이터 객체를 분석한다.

   •     군집 내 유사성의 극대화, 군집 간 유사성 최소화를 원칙으로 군집화
         한다.

   •     분류법을 만드는데도 이용할 수 있다.




12년 11월 14일 수요일
감독학습과 자율학습


   •     감독학습 : 입출력 간의 관계를 결정하는 시스템에 대한 유용한 근사
         시스템을 구하는 것. 예를 들면 회귀분석이나 판별분석

   •     자율학습 : 데이터에 존재하는 여러 가지 형태의 특징을 찾는 데 그
         목표를 둔다. 예를 들면, 군집분석

   •     자율학습은 감독학습에 비해 목표가 구체적이지 못해서 작업이 어
         렵다.




12년 11월 14일 수요일
데이터마이닝 적용사례




12년 11월 14일 수요일
•   신용카드사의 부정사용자 적발을 위한 데이터마이닝

                  •   이동통신사 고객이탈방지를 위한 데이터마이닝

                  •   개인신용평가를 위한 데이터마이닝

                  •   DNA 칩 자료분석에서의 데이터마이닝




12년 11월 14일 수요일
end.




12년 11월 14일 수요일
1 de 23

Recomendados

Bigdata por
BigdataBigdata
BigdataJongmyoung Kim
1.2K visualizações17 slides
Hadoop 기반 빅데이터 이해 por
Hadoop 기반 빅데이터 이해Hadoop 기반 빅데이터 이해
Hadoop 기반 빅데이터 이해아이웍스 | iWorks Inc.
6.1K visualizações21 slides
빅데이터 시대 새로운 신기술과 활용방향 por
빅데이터 시대 새로운 신기술과 활용방향빅데이터 시대 새로운 신기술과 활용방향
빅데이터 시대 새로운 신기술과 활용방향Webometrics Class
2.1K visualizações20 slides
Big Data 대충 알아보기 por
Big Data 대충 알아보기Big Data 대충 알아보기
Big Data 대충 알아보기iron han
1.7K visualizações15 slides
빅데이터 개요 por
빅데이터 개요빅데이터 개요
빅데이터 개요beom kyun choi
6.5K visualizações13 slides
빅데이터_ISP수업 por
빅데이터_ISP수업빅데이터_ISP수업
빅데이터_ISP수업jrim Choi
1.8K visualizações51 slides

Mais conteúdo relacionado

Mais procurados

시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21 por
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21Donghan Kim
4.2K visualizações38 slides
빅데이터란? por
빅데이터란?빅데이터란?
빅데이터란?Yoseop Shin
8.1K visualizações20 slides
빅데이터 솔루션 소개서(2013년 05월) por
빅데이터 솔루션 소개서(2013년 05월)빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)동학 노
11.5K visualizações19 slides
빅데이터 이용 사례 분석 por
빅데이터 이용 사례 분석빅데이터 이용 사례 분석
빅데이터 이용 사례 분석ko donghwi
6.4K visualizações13 slides
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410 por
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410Peter Woo
7.4K visualizações33 slides
전문가토크릴레이 2탄 빅데이터와 빅데이터 분석 (이경일 대표) por
전문가토크릴레이 2탄 빅데이터와 빅데이터 분석 (이경일 대표)전문가토크릴레이 2탄 빅데이터와 빅데이터 분석 (이경일 대표)
전문가토크릴레이 2탄 빅데이터와 빅데이터 분석 (이경일 대표)Saltlux zinyus
6.1K visualizações74 slides

Mais procurados(20)

시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21 por Donghan Kim
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
Donghan Kim4.2K visualizações
빅데이터란? por Yoseop Shin
빅데이터란?빅데이터란?
빅데이터란?
Yoseop Shin8.1K visualizações
빅데이터 솔루션 소개서(2013년 05월) por 동학 노
빅데이터 솔루션 소개서(2013년 05월)빅데이터 솔루션 소개서(2013년 05월)
빅데이터 솔루션 소개서(2013년 05월)
동학 노11.5K visualizações
빅데이터 이용 사례 분석 por ko donghwi
빅데이터 이용 사례 분석빅데이터 이용 사례 분석
빅데이터 이용 사례 분석
ko donghwi6.4K visualizações
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410 por Peter Woo
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
Peter Woo7.4K visualizações
전문가토크릴레이 2탄 빅데이터와 빅데이터 분석 (이경일 대표) por Saltlux zinyus
전문가토크릴레이 2탄 빅데이터와 빅데이터 분석 (이경일 대표)전문가토크릴레이 2탄 빅데이터와 빅데이터 분석 (이경일 대표)
전문가토크릴레이 2탄 빅데이터와 빅데이터 분석 (이경일 대표)
Saltlux zinyus6.1K visualizações
빅데이터 활용사례 by GoldenWired INC. por Byounghee Kim
빅데이터 활용사례 by GoldenWired INC.빅데이터 활용사례 by GoldenWired INC.
빅데이터 활용사례 by GoldenWired INC.
Byounghee Kim10.3K visualizações
빅 데이터 개요 및 활용 por Jin wook
빅 데이터 개요 및 활용빅 데이터 개요 및 활용
빅 데이터 개요 및 활용
Jin wook10.5K visualizações
BigData, Hadoop과 Node.js por 고포릿 default
BigData, Hadoop과 Node.jsBigData, Hadoop과 Node.js
BigData, Hadoop과 Node.js
고포릿 default4.7K visualizações
UNUS BEANs 소개서 20141015 por YoungMin Jeon
UNUS BEANs 소개서 20141015UNUS BEANs 소개서 20141015
UNUS BEANs 소개서 20141015
YoungMin Jeon1.2K visualizações
빅데이터의 활용 por 수보 김
빅데이터의 활용빅데이터의 활용
빅데이터의 활용
수보 김6.6K visualizações
빅데이터의 이해 por 수보 김
빅데이터의 이해빅데이터의 이해
빅데이터의 이해
수보 김25.7K visualizações
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data por K data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
K data698 visualizações
데이터 사이언스 소개 - 정준호 por 준호 정
데이터 사이언스 소개 -  정준호데이터 사이언스 소개 -  정준호
데이터 사이언스 소개 - 정준호
준호 정2.7K visualizações
빅데이터 por Kangwook Lee
빅데이터빅데이터
빅데이터
Kangwook Lee9.4K visualizações
Process for Big Data Analysis por Myunggoon Choi
Process for Big Data AnalysisProcess for Big Data Analysis
Process for Big Data Analysis
Myunggoon Choi2.1K visualizações
2015 경영과 정보기술 - 빅데이터(Big Data) por kyunguk_Kim
2015 경영과 정보기술 - 빅데이터(Big Data)2015 경영과 정보기술 - 빅데이터(Big Data)
2015 경영과 정보기술 - 빅데이터(Big Data)
kyunguk_Kim1.3K visualizações
Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2 por Donghan Kim
 Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2 Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
Donghan Kim5.2K visualizações
실리콘 밸리 데이터 사이언티스트의 하루 por Jaimie Kwon (권재명)
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루
Jaimie Kwon (권재명)29.7K visualizações
빅 데이터 비즈니스 모델 por datasciencekorea
빅 데이터 비즈니스 모델빅 데이터 비즈니스 모델
빅 데이터 비즈니스 모델
datasciencekorea10.2K visualizações

Destaque

임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회) por
임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)
임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)Boram Lim
1.5K visualizações30 slides
[2014년 3월 25일] mining minds 빅 데이터, 욕망을 읽다 por
[2014년 3월 25일] mining minds   빅 데이터, 욕망을 읽다[2014년 3월 25일] mining minds   빅 데이터, 욕망을 읽다
[2014년 3월 25일] mining minds 빅 데이터, 욕망을 읽다gilforum
1.3K visualizações36 slides
집단지성 프로그래밍 01-데이터마이닝 개요 por
집단지성 프로그래밍 01-데이터마이닝 개요집단지성 프로그래밍 01-데이터마이닝 개요
집단지성 프로그래밍 01-데이터마이닝 개요Kwang Woo NAM
6.6K visualizações28 slides
Post PC 시대를 위한 VMware Solution por
Post PC 시대를 위한 VMware SolutionPost PC 시대를 위한 VMware Solution
Post PC 시대를 위한 VMware Solutionmosaicnet
889 visualizações32 slides
성경적 재정 관리 Upload por
성경적 재정 관리 Upload성경적 재정 관리 Upload
성경적 재정 관리 UploadJoonhoan Kim
2.4K visualizações33 slides
고대8 9주 빅데이터 por
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터JM code group
884 visualizações29 slides

Destaque(20)

임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회) por Boram Lim
임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)
임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)
Boram Lim1.5K visualizações
[2014년 3월 25일] mining minds 빅 데이터, 욕망을 읽다 por gilforum
[2014년 3월 25일] mining minds   빅 데이터, 욕망을 읽다[2014년 3월 25일] mining minds   빅 데이터, 욕망을 읽다
[2014년 3월 25일] mining minds 빅 데이터, 욕망을 읽다
gilforum1.3K visualizações
집단지성 프로그래밍 01-데이터마이닝 개요 por Kwang Woo NAM
집단지성 프로그래밍 01-데이터마이닝 개요집단지성 프로그래밍 01-데이터마이닝 개요
집단지성 프로그래밍 01-데이터마이닝 개요
Kwang Woo NAM6.6K visualizações
Post PC 시대를 위한 VMware Solution por mosaicnet
Post PC 시대를 위한 VMware SolutionPost PC 시대를 위한 VMware Solution
Post PC 시대를 위한 VMware Solution
mosaicnet889 visualizações
성경적 재정 관리 Upload por Joonhoan Kim
성경적 재정 관리 Upload성경적 재정 관리 Upload
성경적 재정 관리 Upload
Joonhoan Kim2.4K visualizações
고대8 9주 빅데이터 por JM code group
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터
JM code group884 visualizações
스타트업사례로 본 로그 데이터분석 : Tajo on AWS por Gruter
스타트업사례로 본 로그 데이터분석 : Tajo on AWS스타트업사례로 본 로그 데이터분석 : Tajo on AWS
스타트업사례로 본 로그 데이터분석 : Tajo on AWS
Gruter3K visualizações
Deview RecoPick팀 AWS에서 추쳔 구현하기 por Chaehyun Lee
Deview RecoPick팀 AWS에서 추쳔 구현하기Deview RecoPick팀 AWS에서 추쳔 구현하기
Deview RecoPick팀 AWS에서 추쳔 구현하기
Chaehyun Lee11.4K visualizações
Meetup history por Mk Kim
Meetup historyMeetup history
Meetup history
Mk Kim1.8K visualizações
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁 por datasciencekorea
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
datasciencekorea1.5K visualizações
집단지성 프로그래밍 06-의사결정트리-01 por Kwang Woo NAM
집단지성 프로그래밍 06-의사결정트리-01집단지성 프로그래밍 06-의사결정트리-01
집단지성 프로그래밍 06-의사결정트리-01
Kwang Woo NAM17.3K visualizações
4 voc비정형분석 문종영 por Saltlux Inc.
4 voc비정형분석 문종영4 voc비정형분석 문종영
4 voc비정형분석 문종영
Saltlux Inc.4.6K visualizações
Amazon Elastcsearch Service 소개 및 활용 방법 (윤석찬) por Amazon Web Services Korea
Amazon Elastcsearch Service 소개 및 활용 방법 (윤석찬) Amazon Elastcsearch Service 소개 및 활용 방법 (윤석찬)
Amazon Elastcsearch Service 소개 및 활용 방법 (윤석찬)
Amazon Web Services Korea13.1K visualizações
Dm ml study_roadmap por Kang Pilsung
Dm ml study_roadmapDm ml study_roadmap
Dm ml study_roadmap
Kang Pilsung5.1K visualizações
Microsoft azure service 소개자료 por Alvin You
Microsoft azure service 소개자료Microsoft azure service 소개자료
Microsoft azure service 소개자료
Alvin You6K visualizações
기술사업화강의자료 por WASIS
기술사업화강의자료기술사업화강의자료
기술사업화강의자료
WASIS4.4K visualizações
마인즈랩 통합 VOC 관리 솔루션 소개_20151030 por Taejoon Yoo
마인즈랩 통합 VOC 관리 솔루션 소개_20151030마인즈랩 통합 VOC 관리 솔루션 소개_20151030
마인즈랩 통합 VOC 관리 솔루션 소개_20151030
Taejoon Yoo8.2K visualizações
AWS Enterprise Summit :: 빅데이터 워크로드를 위한 AWS 활용방법 (김기완 솔루션즈 아키텍트) por Amazon Web Services Korea
AWS Enterprise Summit :: 빅데이터 워크로드를 위한 AWS 활용방법 (김기완 솔루션즈 아키텍트)AWS Enterprise Summit :: 빅데이터 워크로드를 위한 AWS 활용방법 (김기완 솔루션즈 아키텍트)
AWS Enterprise Summit :: 빅데이터 워크로드를 위한 AWS 활용방법 (김기완 솔루션즈 아키텍트)
Amazon Web Services Korea4.2K visualizações
[211] 네이버 검색과 데이터마이닝 por NAVER D2
[211] 네이버 검색과 데이터마이닝[211] 네이버 검색과 데이터마이닝
[211] 네이버 검색과 데이터마이닝
NAVER D211K visualizações

Similar a 데이터마이닝의 개요

Learning analytics por
Learning analyticsLearning analytics
Learning analyticsJunghyun Nam
530 visualizações30 slides
2017 주요 기술 흐름 및 개요 por
2017 주요 기술 흐름 및 개요2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요Hosung Lee
439 visualizações37 slides
Big Data Overview por
Big Data OverviewBig Data Overview
Big Data OverviewKeeyong Han
2.9K visualizações38 slides
Bigdate & R programming por
Bigdate & R programmingBigdate & R programming
Bigdate & R programmingSeongWan Son
206 visualizações15 slides
학습분석(Learning Analytics) 활용 가능성 및 전망 por
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망Open Cyber University of Korea
9.5K visualizações41 slides
How to Create Value from Data, and Its Difficulty por
How to Create Value from Data, and Its DifficultyHow to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its DifficultyDataya Nolja
209 visualizações22 slides

Similar a 데이터마이닝의 개요(20)

Learning analytics por Junghyun Nam
Learning analyticsLearning analytics
Learning analytics
Junghyun Nam530 visualizações
2017 주요 기술 흐름 및 개요 por Hosung Lee
2017 주요 기술 흐름 및 개요2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요
Hosung Lee439 visualizações
Big Data Overview por Keeyong Han
Big Data OverviewBig Data Overview
Big Data Overview
Keeyong Han2.9K visualizações
Bigdate & R programming por SeongWan Son
Bigdate & R programmingBigdate & R programming
Bigdate & R programming
SeongWan Son206 visualizações
How to Create Value from Data, and Its Difficulty por Dataya Nolja
How to Create Value from Data, and Its DifficultyHow to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its Difficulty
Dataya Nolja209 visualizações
Things Data Scientists Should Keep in Mind por Dataya Nolja
Things Data Scientists Should Keep in MindThings Data Scientists Should Keep in Mind
Things Data Scientists Should Keep in Mind
Dataya Nolja40 visualizações
Introduction to ankus(data mining and machine learning open source) por SuHyun Jeon
Introduction to ankus(data mining and machine learning open source)Introduction to ankus(data mining and machine learning open source)
Introduction to ankus(data mining and machine learning open source)
SuHyun Jeon2.1K visualizações
집단지성프로그래밍CH1 por HyeonSeok Choi
집단지성프로그래밍CH1집단지성프로그래밍CH1
집단지성프로그래밍CH1
HyeonSeok Choi1.9K visualizações
빅데이터플랫폼구축_개방형플랫폼중심.pdf por 효근 윤
빅데이터플랫폼구축_개방형플랫폼중심.pdf빅데이터플랫폼구축_개방형플랫폼중심.pdf
빅데이터플랫폼구축_개방형플랫폼중심.pdf
효근 윤24 visualizações
연구데이터 관리와 데이터 관리 계획서 (DMP) - part04 por Suntae Kim
연구데이터 관리와 데이터 관리 계획서 (DMP) - part04연구데이터 관리와 데이터 관리 계획서 (DMP) - part04
연구데이터 관리와 데이터 관리 계획서 (DMP) - part04
Suntae Kim4.5K visualizações
데이터 사이언티스트 키노트 Pt 20141008 por Myung-Hoe Huh
데이터 사이언티스트 키노트 Pt 20141008데이터 사이언티스트 키노트 Pt 20141008
데이터 사이언티스트 키노트 Pt 20141008
Myung-Hoe Huh2.8K visualizações
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data) por Myungjin Lee
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
Myungjin Lee13.9K visualizações
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa por 영진 박
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
2012.04.11 미래사회와 빅 데이터(big data) 기술 nipa
영진 박1.9K visualizações
[D2 CAMPUS] Tech meet-up `data science` 발표자료 por NAVER D2
[D2 CAMPUS] Tech meet-up `data science` 발표자료[D2 CAMPUS] Tech meet-up `data science` 발표자료
[D2 CAMPUS] Tech meet-up `data science` 발표자료
NAVER D2896 visualizações
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해 por pinetreeopenclass
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
[파인트리오픈클래스] 엑셀을 활용한 데이터 분석과 이해
pinetreeopenclass3K visualizações
빅데이터 플랫폼 새로운 미래 por Wooseung Kim
빅데이터 플랫폼 새로운 미래빅데이터 플랫폼 새로운 미래
빅데이터 플랫폼 새로운 미래
Wooseung Kim4.6K visualizações
집단지성Ch12 por HyeonSeok Choi
집단지성Ch12집단지성Ch12
집단지성Ch12
HyeonSeok Choi770 visualizações
데이터드리븐 DX 추진방안_202306.pdf por Yunjeong Susan Hong
데이터드리븐 DX 추진방안_202306.pdf데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf
Yunjeong Susan Hong17 visualizações

데이터마이닝의 개요

  • 1. 데이터마이닝의 개요 김인권 ingunbi@gmail.com 12년 11월 14일 수요일
  • 2. 데이터마이닝은 데이터베이스, 데이터 웨어하우스 또는 다른 정보 저장소에 저장된 방대한 양의 데이터로부터 흥미로운 패 턴을 발견하는 작업이다. 12년 11월 14일 수요일
  • 4. 정보와 데이터 • 수년 전 부터 여러 분야에 정보라는 단어와 결합 • 인터넷을 비롯한 컴퓨터의 발전은 데이터 베이스를 포한하여 정보 를 다루는 기술이 폭발적으로 발전 • 스마트폰과 소셜 네트워크로 더욱 자유롭게 정보의 생산과 공유, 전 파가 가능 • 유용한 정보를 캐내는 ‘데이터마이닝’이 주목받기 시작 12년 11월 14일 수요일
  • 5. 다차원 데이터 분석 • 대용량의 데이터는 관측값의 수와 데이터의 차원(속성 또는 변수)이 크다. • 전통적인 통계학에서의 분석방법으로는 한계 노출 • 다차원의 데이터에 적합한 새로운 분석방법 마련이 필요 12년 11월 14일 수요일
  • 6. 정보처리기술의 발전 • 정보를 적절히 처리하는 기술이 필요 • 1980년대 하드웨어 발전으로 대용량 데이터 저장 및 처리 가능 • 1990년대 인터넷 관련 기술의 발전과 더불어 실시간 의사결정시스 템 가능. 데이터웨어하우징 기술의 발달 • 21세기에는 소셜 네트워크에서 관계분석 및 텍스트마이닝 등으로 활용 분야 확장 12년 11월 14일 수요일
  • 7. 고객관계관리의 도입 • 기업의 전통적인 자원을 효과적으로 관리 및 운영해야 한다. • 새로운 제품과 서비스를 창출해 내는 또 다른 자원도 관리해야 한다. • 기업의 생존과 발전을 하기위해서는 고객의 요구를 파악해야한다. • 데이터마이닝이 크게 활성화된 동기는 고객정보를 축적 및 사용하 는 고객관계관리(CRM)를 도입하면서부터이다. 12년 11월 14일 수요일
  • 9. 데이터마이닝의 정의 팅 컴퓨 뉴로 통계학 패턴인식 기계학습 인공지능 데이터마이닝 데이터베이스 지식발견 • 다량의 가공하지 않은 데이터로부터 소량의 귀중한 덩어리를 찾아 내는 과정 • 발굴된 값진 정보를 사용자가 전문적인 지식 없이 사용할 수 있도록 제공하는 시스템 개발과정까지 포함하기도 한다. 12년 11월 14일 수요일
  • 10. 데이터마이닝과 OLAP의 차이점 • 데이터마이닝은 예측가능한 정보의 추출을 시행한다. • OLAP는 TOP-DOWN 방식으로 효율적인 의사 결정에 도움을 주 도록 한다. • 데이터마이닝은 DOWN-TOP 방식으로 영향을 미치는 인자들이 무엇인지 탐사하는데 도움을 준다. 12년 11월 14일 수요일
  • 11. 데이터마이닝 과정 분석 계획 탐색 DELPA 처리 표현 탐색 • 계획 - 문제제기 • 탐색 - 데이터의 특성 찾기 • 표현 - 비주얼적으로 특성을 표현 • 처리 & 분석 12년 11월 14일 수요일
  • 12. 데이터마이닝의 특징 특징 비고 - 시간의 흐름에 따라 축적됨 대용량의 관측 가능한 자료 - 데이터 분석을 업무에 두지 않는 경우가 많음 컴퓨터 집약적 기법 - 컴퓨터의 강력한 처리속도와 능력 활용 (computer-intensive - 기존 분석기법의 한계 극복 method) 경험적 방법(adhockery - 경험에 기초하여 기법 개발 method) - 수리적 특성이 규명되지 않는 기법도 존재 일반화(generalization) - 일반화는 새로운 데이터에 얼마나 잘 적용되는가를 의미 업무활용성(business - 다양한 경영상황하에서 경쟁력 확보를 위한 의사결정을 지원 aplications) 12년 11월 14일 수요일
  • 13. 데이터마이닝 관련 분야 12년 11월 14일 수요일
  • 14. 연구분야 분야 세부설명 - 데이터마이닝과 가장 유사한 의미 KDD(knowledge discoverty - 지식을 추출하는 전 과정 in database) - 데이터마이닝은 OLAP이나 웨어하우징 등과 마찬가지로 전체적인 KDD 과정 중 한 과정인 탐사 단계를 의미 기계학습(machine learning) - 인공지능의 한 분야로 자동적인 학습기법을 설계하고 구현하는 분야 패턴인식(pattern - 공학에서 출발하였으며, 이미지 분류와 깊은 관련이 잇음 recognition) - 데이터베이스에서 유용한 패턴을 찾아내는 다양한 기법을 제공 뉴로컴퓨팅 - 신경망 등과 관련된 학문적 배경을 가짐 (neurocomputing) 통계학(statistics) - 데이터마이닝은 대부분 통계학의 한 분야라고 할 수 있다 12년 11월 14일 수요일
  • 15. 활용분야 • 고객관계관리 • 생명정보학 • 신용평가 • ETC...... • 품질개선 • 부정행위 적발 • 이미지분석 12년 11월 14일 수요일
  • 17. 연관성 분석 • 주어진 데이터의 집합에서 함께 빈번하게 발생하는 속성에 대한 조 건을 나타내는 연관규칙을 발견하는 것 • 장바구니 분석, 트랜젝션 분석에 사용 12년 11월 14일 수요일
  • 18. 분류와 예측 • 목표범주를 설명하고, 구별하는 모형의 집합을 찾는 과정 • 새로운 객체가 관측 되었을 때, 이를 적절한 목표범주에 할당할 수 있도록 분류모형을 구축하는 것이 목적. • 판별분류규칙, 의사결정나무, 폴리클래스, 신경망 등등 • 관련성 분석을 선행하여 효과적인 예측모형을 구축한다. 12년 11월 14일 수요일
  • 19. 군집분석 • 이미 알려진 범주값을 참고하지 않고 데이터 객체를 분석한다. • 군집 내 유사성의 극대화, 군집 간 유사성 최소화를 원칙으로 군집화 한다. • 분류법을 만드는데도 이용할 수 있다. 12년 11월 14일 수요일
  • 20. 감독학습과 자율학습 • 감독학습 : 입출력 간의 관계를 결정하는 시스템에 대한 유용한 근사 시스템을 구하는 것. 예를 들면 회귀분석이나 판별분석 • 자율학습 : 데이터에 존재하는 여러 가지 형태의 특징을 찾는 데 그 목표를 둔다. 예를 들면, 군집분석 • 자율학습은 감독학습에 비해 목표가 구체적이지 못해서 작업이 어 렵다. 12년 11월 14일 수요일
  • 22. 신용카드사의 부정사용자 적발을 위한 데이터마이닝 • 이동통신사 고객이탈방지를 위한 데이터마이닝 • 개인신용평가를 위한 데이터마이닝 • DNA 칩 자료분석에서의 데이터마이닝 12년 11월 14일 수요일