SlideShare uma empresa Scribd logo
1 de 88
Baixar para ler offline
2020. 06. 11 (목)
파이썬을 활용한
데이터 시각화 라이브러리 Plotly
1주차 - 강의소개 및 데이터 시각화 방법론 & 사례
강사 : 신재춘 & 박은상
강의 소개
강사 소개
•신재춘
•코어닷투데이 데이터 크리에이터
•21대 총선 만19세 유권자 분석
•박은상
•코어닷투데이 데이터 크리에이터
•미슐랭 식당 분석,
휴대폰 가격변화 분석 등
강의 내용
•시각화 이론
•Python 기초
•Plotly
•데이터 수집 및 인터랙티브 시각화
•캡스톤 프로젝트
데이터 시각화란?
데이터 = ?
데이터의 정의
데이터란?
•데이터
•관찰을 통해 수집되는 특성 또는 정보(일반적으로 수치)
•문자, 숫자, 소리, 영상, 단어 등
•데이터 유형
•정형데이터
•양적 자료(정량적)
•숫자로 얻을 수 있는 또는 표현될 수 있는 데이터, 수치 자료 (Numerical data)
•질적 자료(정성적)
•숫자로 표현할 수 없는 범주 데이터, 범주형 자료 (Categorical data)
•비정형 데이터
•이미지, 영상, 소리, 언어 등
데이터의 정의
데이터란?
•데이터 유형 - 정형데이터
데이터 예시
데이터의 정의
데이터란?
•비정형 데이터
•Unstructured data
•문서, 동영상, 사진, 음성 등의 형태를 정의할 수 없는 데이터
•분석을 위해서는 비정형 데이터를 정형화하는 다양한 과정이 필요
워드클라우드 워드 임베딩 이미지 임베딩
데이터 시각화의 정의
데이터 시각화란?
•데이터 시각화
•정의
•데이터(또는 분석 결과)를 쉽게 이해할 수 있도록
도표라는 시각적 수단을 통해 정보를 효과적으로 전달하는 것
•정보의 효과적 전달!!
데이터 시각화의 효과
데이터 시각화란?
인간의 가장 강력한 감각 기관인 눈은
냄새, 소리, 맛, 촉감을 위한 기관보다 대역폭과 처리 능력이 훨씬 더 크다.
그러므로 정보시각화를 통한 데이터 표현은
인간의 가장 강력한 지각 능력을 최대한 효과적으로 활용하는 방법이다.
- 애덤페러, 아름다운 시각화
데이터 시각화의 효과
데이터 시각화란?
Quiz 1.
데이터 시각화의 효과
데이터 시각화란?
37 x 74 = ?
12
11
10
9
8
7
6
5
4
3
2
1
데이터 시각화의 효과
데이터 시각화란?
Quiz 2.
데이터 시각화의 효과
데이터 시각화란?
1 2 4 6 7 4 3 9 3 4 6 8 3 2 3 5 1 9 4 1
2 3 5 0 8 3 9 7 5 0 4 2 3 4 9 1 2 3 2 7
7 8 2 5 6 8 1 3 8 3 6 9 9 7 5 8 9 4 1 2
4 6 7 9 2 2 5 8 2 3 5 6 8 5 3 7 2 3 5 6
12
11
10
9
8
7
6
5
4
3
2
1
데이터 시각화의 효과
데이터 시각화란?
1 2 4 6 7 4 3 9 3 4 6 8 3 2 3 5 7 9 4 1
7 2 3 5 0 8 3 9 5 0 4 2 3 4 9 1 2 3 2 7
8 2 5 6 8 1 3 8 3 7 6 9 9 2 5 8 9 4 1 2
4 6 7 9 2 7 5 8 2 3 5 6 8 5 3 7 2 3 5 6
12
11
10
9
8
7
6
5
4
3
2
1
데이터 시각화의 효과
데이터 시각화란?
1 2 4 6 7 4 3 9 3 4 6 8 3 2 3 5 7 9 4 1
2 3 5 0 8 3 9 7 5 0 4 2 3 4 9 1 2 3 2 7
7 8 2 5 6 8 1 3 8 3 6 9 9 7 5 8 9 4 1 2
4 6 7 9 2 7 5 8 2 3 5 6 8 5 3 7 2 3 5 6
12
11
10
9
8
7
6
5
4
3
2
1
데이터 시각화의 목적
데이터 시각화란?
•많은 양의 데이터를 한눈에 볼 수 있다.
•데이터 분석에 대한 전문 지식이 없어도,
누구나 쉽게 데이터 인사이트를 찾을 수 있다.
•요약 통계보다 정확한 데이터 분석 결과를 도출할 수 있다.
•효과적인 데이터 인사이트 공유로 데이터 기반의 의사결정을 할 수 있다.
•데이터 시각화를 활용할 수 있는 분야와 방법이 무궁무진하다.
데이터 시각화의 목적
데이터 시각화란?
•많은 양의 데이터를 한눈에 볼 수 있다.
•시각적 요소를 활용해 요약해 표현
서울시 상권 유동인구 데이터
데이터 시각화의 목적
데이터 시각화란?
•데이터 분석에 대한 전문 지식이 없어도,
누구나 쉽게 데이터 인사이트를 찾을 수 있다.
2015 건강보험심사자료로 알아보는
대한민국 우울증 환자 및 치료 현황
데이터 시각화의 목적
데이터 시각화란?
•요약 통계보다 정확한 데이터 분석 결과를 도출할 수 있다.
데이터 시각화의 목적
데이터 시각화란?
•효과적인 데이터 인사이트 공유로 데이터 기반의 의사결정을 할 수 있다.
데이터 시각화의 목적
데이터 시각화란?
•데이터 시각화를 활용할 수 있는 분야와 방법이 무궁무진하다.
데이터 시각화의 목적
데이터 시각화란?
•데이터 시각화를 활용할 수 있는 분야와 방법이 무궁무진하다.
방송사 데이터 저널리즘 데이터 시각화 전문기업
데이터 시각화 방법론
다양한 시각화 방식 데이터 시각화 방법론
•시각적 속성
•위치, 형태, 크기, 색
다양한 시각화 방식 데이터 시각화 방법론
•수량의 시각화
•분포의 시각화
•비율의 시각화
•x - y 관계의 시각화
•지리공간의 시각화
•불확실성의 시각화
다양한 시각화 방식 데이터 시각화 방법론
•수량의 시각화
•막대 - 묶은 막대, 누적 막대
•점
•히트맵
다양한 시각화 방식 데이터 시각화 방법론
•수량의 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•수량의 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•수량의 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•수량의 시각화 예시
단위의 차이가 클 경우
차이가 크지 않을 경우
다양한 시각화 방식 데이터 시각화 방법론
•수량의 시각화 예시
히트맵 실제 적용 사례
다양한 시각화 방식 데이터 시각화 방법론
•분포의 시각화
•히스토그램
•밀도, 누적밀도
•Quantile-Quantile plot(Q-Q plot)
•Box plot, etc
다양한 시각화 방식 데이터 시각화 방법론
•분포의 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•분포의 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•비율의 시각화
•파이차트
•막대, 누적 막대/밀도
•모자이크, 트리맵, 평행 집합
다양한 시각화 방식 데이터 시각화 방법론
•비율의 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•비율의 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•비율의 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•x - y 관계로 나타내는 시각화
•산점도, 버블 차트
•밀도 등고선
•선 그래프
다양한 시각화 방식 데이터 시각화 방법론
•x - y 관계로 나타내는 시각화 예시
Hans Rosling (TED)
The best stats you’ve ever seen
Gapminder
다양한 시각화 방식 데이터 시각화 방법론
•x - y 관계로 나타내는 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•x - y 관계로 나타내는 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•x - y 관계로 나타내는 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•x - y 관계로 나타내는 시각화예시
다양한 시각화 방식 데이터 시각화 방법론
•x - y 관계로 나타내는 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•x - y 관계로 나타내는 시각화 예시
63.27
49.57
31.13
18.27
-37.63
(-)45
(-)55
다양한 시각화 방식 데이터 시각화 방법론
•x - y 관계로 나타내는 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•지리공간 데이터의 시각화
•지도
•단계구분도
•카토그램
다양한 시각화 방식 데이터 시각화 방법론
•지리공간 데이터의 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•지리공간 데이터의 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•지리공간 데이터의 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•지리공간 데이터의 시각화 예시
다양한 시각화 방식 데이터 시각화 방법론
•불확실성의 시각화
•오차 막대
•눈 모양 도표
•신뢰 대역
다양한 시각화 방식 데이터 시각화 방법론
•불확실성의 시각화 예시
데이터 시각화 사례
나폴레옹 진군 맵
데이터 시각화 사례
•나폴레옹 군대의 출정과 복귀
1854년 Broad가의 콜레라 발병 맵
데이터 시각화 사례
•콜레라 발병 원인 파악 및 해결책 제시
크림 전쟁 당시 사망 원인
데이터 시각화 사례
•나이팅 게일 - 사망 원인 분석
Next America
데이터 시각화 사례
•미국 인구 통계 데이터 시각화
•향후 예상되는 인구 통계적
변동과 변화를 추측
•인터랙티브 시각화를 통해
긴 시간의 변화를 명확히 전달
생존자 편향의 오류
데이터 시각화 사례
•2차 세계대전 미군 전투기 외상 시각화
Google & Naver Trend
데이터 시각화 사례
•검색어 트렌드 확인
NAME Chart
데이터 시각화 사례
•아기 이름 데이터 시각화
대법원 전자가족관계등록시스템 활용
코로나19
데이터 시각화 사례
•코로나 확진자 이동 경로 시각화
SKT 2020 지하철 리포트
데이터 시각화 사례
•통신 데이터를 활용한 지하철 이용 패턴 및 코로나19 영향 분석
SKT 2020 지하철 리포트
데이터 시각화 사례
•통신 데이터를 활용한 지하철 이용 패턴 및 코로나19 영향 분석
SKT 2020 지하철 리포트
데이터 시각화 사례
•통신 데이터를 활용한 지하철 이용 패턴 및 코로나19 영향 분석
사례 사이트 모음
• Information is beautiful
• https://informationisbeautiful.net/
• SBS 마부작침
• http://news.sbs.co.kr/news/mabuList.do
• KBS 데이터룸
• http://news.kbs.co.kr/news/list.do?mcd=0909&ref=pMenu#1
• 중앙일보 데이터 브루
• https://databrew.joins.com/deepbrew
• 한국경제 뉴스래빗 데이터랩
• http://newslabit.hankyung.com/list/groups/datalab
• TangibleVitz
• https://www.tangiblevitz.com/data-storytelling
• howmuch.net
• https://howmuch.net/
• 한국데이터산업진흥원 - 데이터 안심구역
• http://datakorea.datastore.or.kr/
데이터 시각화 도구
MS Excel
데이터 시각화 도구
•가장 쉽고 일반적으로 사용 가능한 도구
•한계가 명확
•확장성 부족
MS Power BI
데이터 시각화 도구
•Excel에서 불가능한 대용량 파일 처리
•Tableau와 유사
•웹에서 사용 가능
•윈도우 전용
Tableau
데이터 시각화 도구
•대시보드 목적의 도구
•사용자(기업) 증가
•많은 기능을 쉽게 사용 가능
But, 유료…
데이터 시각화 라이브러리
Matplotlib
데이터 시각화 도구
•파이썬의 가장 기본적인 시각화 라이브러리
•Pandas와 연계하여 쉽게 시각화 가능
Seaborn
데이터 시각화 도구
•matplotlib 기반으로 다양한 색 테마, 차트 기능을 추가한 라이브러리
•matplotlib에 의존
•matplotlib에 없는 그래프(히트맵, 카운트플랏 등) 포함
Bokeh
데이터 시각화 도구
•웹 최적화 인터랙티브 시각화 라이브러리
•통계 분석 외에도 임의의 데이터 시각화를 지원
•시각화의 요소들을 직접 조절 가능
D3.js
데이터 시각화 도구
•Data-Driven Documents . JavaScript
•데이터 중심의 문서의 약자로 자바스크립트 기반 라이브러리
•사용자가 입력한 시각화 규칙을 바탕으로 데이터를 반영해 시각화 생성
•plotly도 d3.js를 사용하여 시각화
Folium
데이터 시각화 도구
•지도 데이터(Open Street Map) 위치정보를 시각화하는 라이브러리
•자바스크립트 기반으로 인터랙티브 지도 생성
•그 외 pydeck, ipyleaflet 등으로 지도 시각화 가능
파이썬 및 Plotly 설치
파이썬이란?
파이썬이란?
•가장 인기있는 프로그래밍 언어 중 하나이다.
•웹페이지개발, 데이터 분석, 인공지능 등
많은 영역에서 활용된다.
•오픈 소스로 무료로 이용가능하다
세계 프로그래밍 언어 인기 순위
파이썬의 장단점
파이썬이란?
장점
- 문법이 쉬워 쉽게 배울 수 있다.
- 코드를 이해하기 쉽고 수정이 간단하다.
- 데이터분석 및 시각화와 관련된 패키지들이 잘 구성되어있다.
단점
-C, Java등에 비해 속도가 느리다.
-동시다발적인 연산을 하는데 적합하지 않다.
"hello world"를 프린트하기위한 코드
Java vs Python
프로그램 언어별 연산 속도
(값이 클수록 오래걸림)
파이썬으로 할수 있는 것들
파이썬이란?
단순 계산
그래프 그리기
게임 만들기 데이터 분석 및 시각화Mathematics
Plotly란?
•파이썬에서 데이터를 시각화하기 위해서는 matplotlib, seaborn,
plotly등 시각화 라이브러리를 이용해야한다.
•Plotly는 파이썬의 시각화 라이브러리중 하나로 산점도, 막대그래프, 파이차트,
지도 등 다양한 시각화를 데이터를 이용해 구현할 수 있다.
Plotly 의 특징
plotly란?
•plotly.express - 간단한 코드로 효과적인 시각화를 할 수 있는 모듈
•plotly.graph_objects - 비교적 복잡한 코드를 이용해 세세한 설정을 지원하는 모듈
•크게 두가지 성격의 모듈이 있어 필요한 상황에 따라 효율적으로 데이터 시각화를 할 수 있다.
plotly.express(px) plotly.graph_objects(go)
Plotly의 장점
Plotly란?
•plotly의 가장 큰 장점은 interactive한 시각화가 가능하다는 점이다.
마우스를 이용해
개별 데이터값 확인 가능
원하는 데이터의 범위 설정 가능
수고하셨습니다 !
Q & A
참고
• Fundamentals of Data Visualization, Claus O. Wilke
• 데이터시각화 이해하기 #1 데이터 시각화란?
• https://visualize.tistory.com/112
• 당신도 데이터 시각화를 해야 하는 5가지 이유
• http://www.bloter.net/archives/329334
• Anscombe's’ Quartet simulation
• https://www.autodeskresearch.com/publications/samestats
• 생존자 편항의 오류
• https://www.andrewahn.co/silicon-valley/survivorship-bias/
• Python에서 데이터 시각화하는 다양한 방법
• https://zzsza.github.io/development/2018/08/24/data-visualization-in-python/
• Seaborn vs Bokeh. Part 2. Bokeh tutorial
• https://lovit.github.io/visualization/2019/11/22/bokeh_tutorial/
• D3.js 란?
• https://velog.io/@smooth97/-Data-Visualizing-D3.js-%EB%9E%80
• 세계프로그래밍언어 순위
• https://ifuwanna.tistory.com/203
• 파이썬의 장단점
• http://www.itworld.co.kr/print/92103

Mais conteúdo relacionado

Mais procurados

Data Engineering 101
Data Engineering 101Data Engineering 101
Data Engineering 101DaeMyung Kang
 
실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루Jaimie Kwon (권재명)
 
데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립승화 양
 
서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기승화 양
 
서비스 기획자의 데이터 분석
서비스 기획자의 데이터 분석서비스 기획자의 데이터 분석
서비스 기획자의 데이터 분석YOO SE KYUN
 
Bigquery와 airflow를 이용한 데이터 분석 시스템 구축 v1 나무기술(주) 최유석 20170912
Bigquery와 airflow를 이용한 데이터 분석 시스템 구축 v1  나무기술(주) 최유석 20170912Bigquery와 airflow를 이용한 데이터 분석 시스템 구축 v1  나무기술(주) 최유석 20170912
Bigquery와 airflow를 이용한 데이터 분석 시스템 구축 v1 나무기술(주) 최유석 20170912Yooseok Choi
 
웹사이트기획 및 관리
웹사이트기획 및 관리웹사이트기획 및 관리
웹사이트기획 및 관리봉조 김
 
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표Dylan Ko
 
최적화 모델을 이용한 카페 위치 선정 제안
최적화 모델을 이용한 카페 위치 선정 제안최적화 모델을 이용한 카페 위치 선정 제안
최적화 모델을 이용한 카페 위치 선정 제안Yurim Kim
 
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)Dylan Ko
 
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介cyberagent
 
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화Minho Lee
 
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스Minwoo Kim
 
RDF 개념 및 구문 소개
RDF 개념 및 구문 소개RDF 개념 및 구문 소개
RDF 개념 및 구문 소개Dongbum Kim
 
편의점 최적입지 선정을 위한 상권 분석_윤석진
편의점 최적입지 선정을 위한 상권 분석_윤석진편의점 최적입지 선정을 위한 상권 분석_윤석진
편의점 최적입지 선정을 위한 상권 분석_윤석진Sukjin Yoon
 
[236] 카카오의데이터파이프라인 윤도영
[236] 카카오의데이터파이프라인 윤도영[236] 카카오의데이터파이프라인 윤도영
[236] 카카오의데이터파이프라인 윤도영NAVER D2
 
Data pipeline and data lake
Data pipeline and data lakeData pipeline and data lake
Data pipeline and data lakeDaeMyung Kang
 
좌충우돌 Data Engineering 학습기
좌충우돌 Data Engineering 학습기좌충우돌 Data Engineering 학습기
좌충우돌 Data Engineering 학습기DONGMIN LEE
 
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일나 혼자 한다: 개발자가 창업을 하면 벌어지는 일
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일Hyeonjong Gim
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionTetsutaro Watanabe
 

Mais procurados (20)

Data Engineering 101
Data Engineering 101Data Engineering 101
Data Engineering 101
 
실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루
 
데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립
 
서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기서비스 기획자를 위한 데이터분석 시작하기
서비스 기획자를 위한 데이터분석 시작하기
 
서비스 기획자의 데이터 분석
서비스 기획자의 데이터 분석서비스 기획자의 데이터 분석
서비스 기획자의 데이터 분석
 
Bigquery와 airflow를 이용한 데이터 분석 시스템 구축 v1 나무기술(주) 최유석 20170912
Bigquery와 airflow를 이용한 데이터 분석 시스템 구축 v1  나무기술(주) 최유석 20170912Bigquery와 airflow를 이용한 데이터 분석 시스템 구축 v1  나무기술(주) 최유석 20170912
Bigquery와 airflow를 이용한 데이터 분석 시스템 구축 v1 나무기술(주) 최유석 20170912
 
웹사이트기획 및 관리
웹사이트기획 및 관리웹사이트기획 및 관리
웹사이트기획 및 관리
 
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
 
최적화 모델을 이용한 카페 위치 선정 제안
최적화 모델을 이용한 카페 위치 선정 제안최적화 모델을 이용한 카페 위치 선정 제안
최적화 모델을 이용한 카페 위치 선정 제안
 
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
그로스 해킹 & 데이터 프로덕트 (Growth Hacking & Data Product) - 고넥터 고영혁 (Gonnector Dylan Ko)
 
Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介Amebaにおけるレコメンデーションシステムの紹介
Amebaにおけるレコメンデーションシステムの紹介
 
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
그래프에서 대시보드까지, 서비스를 위한 데이터 시각화
 
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
데이터 기반 성장을 위한 선결 조건: Product-Market Fit, Instrumentation, 그리고 프로세스
 
RDF 개념 및 구문 소개
RDF 개념 및 구문 소개RDF 개념 및 구문 소개
RDF 개념 및 구문 소개
 
편의점 최적입지 선정을 위한 상권 분석_윤석진
편의점 최적입지 선정을 위한 상권 분석_윤석진편의점 최적입지 선정을 위한 상권 분석_윤석진
편의점 최적입지 선정을 위한 상권 분석_윤석진
 
[236] 카카오의데이터파이프라인 윤도영
[236] 카카오의데이터파이프라인 윤도영[236] 카카오의데이터파이프라인 윤도영
[236] 카카오의데이터파이프라인 윤도영
 
Data pipeline and data lake
Data pipeline and data lakeData pipeline and data lake
Data pipeline and data lake
 
좌충우돌 Data Engineering 학습기
좌충우돌 Data Engineering 학습기좌충우돌 Data Engineering 학습기
좌충우돌 Data Engineering 학습기
 
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일나 혼자 한다: 개발자가 창업을 하면 벌어지는 일
나 혼자 한다: 개발자가 창업을 하면 벌어지는 일
 
ビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年versionビッグデータ処理データベースの全体像と使い分け
2018年version
ビッグデータ処理データベースの全体像と使い分け
2018年version
 

Semelhante a [울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례

데이터 분석 동향과 비즈스프링이 제공하는 데이터
데이터 분석 동향과 비즈스프링이 제공하는 데이터데이터 분석 동향과 비즈스프링이 제공하는 데이터
데이터 분석 동향과 비즈스프링이 제공하는 데이터BizSpring Inc.
 
Bloter 넥스트 저널리즘 스쿨 강의자료
Bloter 넥스트 저널리즘 스쿨 강의자료Bloter 넥스트 저널리즘 스쿨 강의자료
Bloter 넥스트 저널리즘 스쿨 강의자료neuroassociates
 
디포커스 전홍구
디포커스 전홍구디포커스 전홍구
디포커스 전홍구Newsjelly
 
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big dataK data
 
공공 데이터와 인포그래픽스를 활용한 문화관광기획
공공 데이터와 인포그래픽스를 활용한 문화관광기획공공 데이터와 인포그래픽스를 활용한 문화관광기획
공공 데이터와 인포그래픽스를 활용한 문화관광기획Han Woo PARK
 
Week1 ot
Week1 otWeek1 ot
Week1 otEun Yu
 
빅데이터 분석 시각화 분석 : 4장 빅데이터와 시각화 디자인
빅데이터 분석 시각화 분석 : 4장 빅데이터와 시각화 디자인빅데이터 분석 시각화 분석 : 4장 빅데이터와 시각화 디자인
빅데이터 분석 시각화 분석 : 4장 빅데이터와 시각화 디자인Ji Lee
 
Smarthome appliances SX & UX
Smarthome appliances SX & UXSmarthome appliances SX & UX
Smarthome appliances SX & UXjong K
 
꿈꾸는 데이터 디자이너 시즌2 교육설명회
꿈꾸는 데이터 디자이너 시즌2 교육설명회꿈꾸는 데이터 디자이너 시즌2 교육설명회
꿈꾸는 데이터 디자이너 시즌2 교육설명회neuroassociates
 
데이타 시각화와 정보디자인
데이타 시각화와 정보디자인데이타 시각화와 정보디자인
데이타 시각화와 정보디자인Ji Lee
 
빅데이터의 활용
빅데이터의 활용빅데이터의 활용
빅데이터의 활용수보 김
 
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스Ji Lee
 
데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdfYunjeong Susan Hong
 
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아K data
 
Bigdate & R programming
Bigdate & R programmingBigdate & R programming
Bigdate & R programmingSeongWan Son
 
Big Data Analytics and Data Mining
Big Data Analytics and Data MiningBig Data Analytics and Data Mining
Big Data Analytics and Data MiningSuHyun Jeon
 
Week14 wrapup
Week14 wrapupWeek14 wrapup
Week14 wrapupEun Yu
 
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)Myungjin Lee
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해수보 김
 

Semelhante a [울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례 (20)

데이터 분석 동향과 비즈스프링이 제공하는 데이터
데이터 분석 동향과 비즈스프링이 제공하는 데이터데이터 분석 동향과 비즈스프링이 제공하는 데이터
데이터 분석 동향과 비즈스프링이 제공하는 데이터
 
Bloter 넥스트 저널리즘 스쿨 강의자료
Bloter 넥스트 저널리즘 스쿨 강의자료Bloter 넥스트 저널리즘 스쿨 강의자료
Bloter 넥스트 저널리즘 스쿨 강의자료
 
디포커스 전홍구
디포커스 전홍구디포커스 전홍구
디포커스 전홍구
 
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
 
공공 데이터와 인포그래픽스를 활용한 문화관광기획
공공 데이터와 인포그래픽스를 활용한 문화관광기획공공 데이터와 인포그래픽스를 활용한 문화관광기획
공공 데이터와 인포그래픽스를 활용한 문화관광기획
 
Week1 ot
Week1 otWeek1 ot
Week1 ot
 
빅데이터 분석 시각화 분석 : 4장 빅데이터와 시각화 디자인
빅데이터 분석 시각화 분석 : 4장 빅데이터와 시각화 디자인빅데이터 분석 시각화 분석 : 4장 빅데이터와 시각화 디자인
빅데이터 분석 시각화 분석 : 4장 빅데이터와 시각화 디자인
 
Hadoop 기반 빅데이터 이해
Hadoop 기반 빅데이터 이해Hadoop 기반 빅데이터 이해
Hadoop 기반 빅데이터 이해
 
Smarthome appliances SX & UX
Smarthome appliances SX & UXSmarthome appliances SX & UX
Smarthome appliances SX & UX
 
꿈꾸는 데이터 디자이너 시즌2 교육설명회
꿈꾸는 데이터 디자이너 시즌2 교육설명회꿈꾸는 데이터 디자이너 시즌2 교육설명회
꿈꾸는 데이터 디자이너 시즌2 교육설명회
 
데이타 시각화와 정보디자인
데이타 시각화와 정보디자인데이타 시각화와 정보디자인
데이타 시각화와 정보디자인
 
빅데이터의 활용
빅데이터의 활용빅데이터의 활용
빅데이터의 활용
 
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스
빅데이터 분석 시각화 분석 : 1장 시각화정의 2장 프로세스
 
데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf
 
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
 
Bigdate & R programming
Bigdate & R programmingBigdate & R programming
Bigdate & R programming
 
Big Data Analytics and Data Mining
Big Data Analytics and Data MiningBig Data Analytics and Data Mining
Big Data Analytics and Data Mining
 
Week14 wrapup
Week14 wrapupWeek14 wrapup
Week14 wrapup
 
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
 
빅데이터의 이해
빅데이터의 이해빅데이터의 이해
빅데이터의 이해
 

Mais de Core.Today

Data analysis with python - for Ulsan science high school teachers
Data analysis with python - for Ulsan science high school teachersData analysis with python - for Ulsan science high school teachers
Data analysis with python - for Ulsan science high school teachersCore.Today
 
Python basic grammer
Python basic grammerPython basic grammer
Python basic grammerCore.Today
 
CoreDot TechSeminar 2018 - Session4 Park Eonyong
CoreDot TechSeminar 2018 - Session4 Park EonyongCoreDot TechSeminar 2018 - Session4 Park Eonyong
CoreDot TechSeminar 2018 - Session4 Park EonyongCore.Today
 
CoreDot TechSeminar 2018 - Session2 Ji Donghyun
CoreDot TechSeminar 2018 - Session2 Ji DonghyunCoreDot TechSeminar 2018 - Session2 Ji Donghyun
CoreDot TechSeminar 2018 - Session2 Ji DonghyunCore.Today
 
CoreDot TechSeminar 2018 - Session1 Park Jihun
CoreDot TechSeminar 2018 - Session1 Park JihunCoreDot TechSeminar 2018 - Session1 Park Jihun
CoreDot TechSeminar 2018 - Session1 Park JihunCore.Today
 
CoreDot TechSeminar 2018 - Session3 Doh Seungheon
CoreDot TechSeminar 2018 - Session3 Doh SeungheonCoreDot TechSeminar 2018 - Session3 Doh Seungheon
CoreDot TechSeminar 2018 - Session3 Doh SeungheonCore.Today
 

Mais de Core.Today (6)

Data analysis with python - for Ulsan science high school teachers
Data analysis with python - for Ulsan science high school teachersData analysis with python - for Ulsan science high school teachers
Data analysis with python - for Ulsan science high school teachers
 
Python basic grammer
Python basic grammerPython basic grammer
Python basic grammer
 
CoreDot TechSeminar 2018 - Session4 Park Eonyong
CoreDot TechSeminar 2018 - Session4 Park EonyongCoreDot TechSeminar 2018 - Session4 Park Eonyong
CoreDot TechSeminar 2018 - Session4 Park Eonyong
 
CoreDot TechSeminar 2018 - Session2 Ji Donghyun
CoreDot TechSeminar 2018 - Session2 Ji DonghyunCoreDot TechSeminar 2018 - Session2 Ji Donghyun
CoreDot TechSeminar 2018 - Session2 Ji Donghyun
 
CoreDot TechSeminar 2018 - Session1 Park Jihun
CoreDot TechSeminar 2018 - Session1 Park JihunCoreDot TechSeminar 2018 - Session1 Park Jihun
CoreDot TechSeminar 2018 - Session1 Park Jihun
 
CoreDot TechSeminar 2018 - Session3 Doh Seungheon
CoreDot TechSeminar 2018 - Session3 Doh SeungheonCoreDot TechSeminar 2018 - Session3 Doh Seungheon
CoreDot TechSeminar 2018 - Session3 Doh Seungheon
 

[울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례

  • 1. 2020. 06. 11 (목) 파이썬을 활용한 데이터 시각화 라이브러리 Plotly 1주차 - 강의소개 및 데이터 시각화 방법론 & 사례 강사 : 신재춘 & 박은상
  • 3. 강사 소개 •신재춘 •코어닷투데이 데이터 크리에이터 •21대 총선 만19세 유권자 분석 •박은상 •코어닷투데이 데이터 크리에이터 •미슐랭 식당 분석, 휴대폰 가격변화 분석 등
  • 4. 강의 내용 •시각화 이론 •Python 기초 •Plotly •데이터 수집 및 인터랙티브 시각화 •캡스톤 프로젝트
  • 7. 데이터의 정의 데이터란? •데이터 •관찰을 통해 수집되는 특성 또는 정보(일반적으로 수치) •문자, 숫자, 소리, 영상, 단어 등 •데이터 유형 •정형데이터 •양적 자료(정량적) •숫자로 얻을 수 있는 또는 표현될 수 있는 데이터, 수치 자료 (Numerical data) •질적 자료(정성적) •숫자로 표현할 수 없는 범주 데이터, 범주형 자료 (Categorical data) •비정형 데이터 •이미지, 영상, 소리, 언어 등
  • 8. 데이터의 정의 데이터란? •데이터 유형 - 정형데이터 데이터 예시
  • 9. 데이터의 정의 데이터란? •비정형 데이터 •Unstructured data •문서, 동영상, 사진, 음성 등의 형태를 정의할 수 없는 데이터 •분석을 위해서는 비정형 데이터를 정형화하는 다양한 과정이 필요 워드클라우드 워드 임베딩 이미지 임베딩
  • 10. 데이터 시각화의 정의 데이터 시각화란? •데이터 시각화 •정의 •데이터(또는 분석 결과)를 쉽게 이해할 수 있도록 도표라는 시각적 수단을 통해 정보를 효과적으로 전달하는 것 •정보의 효과적 전달!!
  • 11. 데이터 시각화의 효과 데이터 시각화란? 인간의 가장 강력한 감각 기관인 눈은 냄새, 소리, 맛, 촉감을 위한 기관보다 대역폭과 처리 능력이 훨씬 더 크다. 그러므로 정보시각화를 통한 데이터 표현은 인간의 가장 강력한 지각 능력을 최대한 효과적으로 활용하는 방법이다. - 애덤페러, 아름다운 시각화
  • 13. 데이터 시각화의 효과 데이터 시각화란? 37 x 74 = ? 12 11 10 9 8 7 6 5 4 3 2 1
  • 15. 데이터 시각화의 효과 데이터 시각화란? 1 2 4 6 7 4 3 9 3 4 6 8 3 2 3 5 1 9 4 1 2 3 5 0 8 3 9 7 5 0 4 2 3 4 9 1 2 3 2 7 7 8 2 5 6 8 1 3 8 3 6 9 9 7 5 8 9 4 1 2 4 6 7 9 2 2 5 8 2 3 5 6 8 5 3 7 2 3 5 6 12 11 10 9 8 7 6 5 4 3 2 1
  • 16. 데이터 시각화의 효과 데이터 시각화란? 1 2 4 6 7 4 3 9 3 4 6 8 3 2 3 5 7 9 4 1 7 2 3 5 0 8 3 9 5 0 4 2 3 4 9 1 2 3 2 7 8 2 5 6 8 1 3 8 3 7 6 9 9 2 5 8 9 4 1 2 4 6 7 9 2 7 5 8 2 3 5 6 8 5 3 7 2 3 5 6 12 11 10 9 8 7 6 5 4 3 2 1
  • 17. 데이터 시각화의 효과 데이터 시각화란? 1 2 4 6 7 4 3 9 3 4 6 8 3 2 3 5 7 9 4 1 2 3 5 0 8 3 9 7 5 0 4 2 3 4 9 1 2 3 2 7 7 8 2 5 6 8 1 3 8 3 6 9 9 7 5 8 9 4 1 2 4 6 7 9 2 7 5 8 2 3 5 6 8 5 3 7 2 3 5 6 12 11 10 9 8 7 6 5 4 3 2 1
  • 18. 데이터 시각화의 목적 데이터 시각화란? •많은 양의 데이터를 한눈에 볼 수 있다. •데이터 분석에 대한 전문 지식이 없어도, 누구나 쉽게 데이터 인사이트를 찾을 수 있다. •요약 통계보다 정확한 데이터 분석 결과를 도출할 수 있다. •효과적인 데이터 인사이트 공유로 데이터 기반의 의사결정을 할 수 있다. •데이터 시각화를 활용할 수 있는 분야와 방법이 무궁무진하다.
  • 19. 데이터 시각화의 목적 데이터 시각화란? •많은 양의 데이터를 한눈에 볼 수 있다. •시각적 요소를 활용해 요약해 표현 서울시 상권 유동인구 데이터
  • 20. 데이터 시각화의 목적 데이터 시각화란? •데이터 분석에 대한 전문 지식이 없어도, 누구나 쉽게 데이터 인사이트를 찾을 수 있다. 2015 건강보험심사자료로 알아보는 대한민국 우울증 환자 및 치료 현황
  • 21. 데이터 시각화의 목적 데이터 시각화란? •요약 통계보다 정확한 데이터 분석 결과를 도출할 수 있다.
  • 22. 데이터 시각화의 목적 데이터 시각화란? •효과적인 데이터 인사이트 공유로 데이터 기반의 의사결정을 할 수 있다.
  • 23. 데이터 시각화의 목적 데이터 시각화란? •데이터 시각화를 활용할 수 있는 분야와 방법이 무궁무진하다.
  • 24. 데이터 시각화의 목적 데이터 시각화란? •데이터 시각화를 활용할 수 있는 분야와 방법이 무궁무진하다. 방송사 데이터 저널리즘 데이터 시각화 전문기업
  • 26. 다양한 시각화 방식 데이터 시각화 방법론 •시각적 속성 •위치, 형태, 크기, 색
  • 27. 다양한 시각화 방식 데이터 시각화 방법론 •수량의 시각화 •분포의 시각화 •비율의 시각화 •x - y 관계의 시각화 •지리공간의 시각화 •불확실성의 시각화
  • 28. 다양한 시각화 방식 데이터 시각화 방법론 •수량의 시각화 •막대 - 묶은 막대, 누적 막대 •점 •히트맵
  • 29. 다양한 시각화 방식 데이터 시각화 방법론 •수량의 시각화 예시
  • 30. 다양한 시각화 방식 데이터 시각화 방법론 •수량의 시각화 예시
  • 31. 다양한 시각화 방식 데이터 시각화 방법론 •수량의 시각화 예시
  • 32. 다양한 시각화 방식 데이터 시각화 방법론 •수량의 시각화 예시 단위의 차이가 클 경우 차이가 크지 않을 경우
  • 33. 다양한 시각화 방식 데이터 시각화 방법론 •수량의 시각화 예시 히트맵 실제 적용 사례
  • 34. 다양한 시각화 방식 데이터 시각화 방법론 •분포의 시각화 •히스토그램 •밀도, 누적밀도 •Quantile-Quantile plot(Q-Q plot) •Box plot, etc
  • 35. 다양한 시각화 방식 데이터 시각화 방법론 •분포의 시각화 예시
  • 36. 다양한 시각화 방식 데이터 시각화 방법론 •분포의 시각화 예시
  • 37. 다양한 시각화 방식 데이터 시각화 방법론 •비율의 시각화 •파이차트 •막대, 누적 막대/밀도 •모자이크, 트리맵, 평행 집합
  • 38. 다양한 시각화 방식 데이터 시각화 방법론 •비율의 시각화 예시
  • 39. 다양한 시각화 방식 데이터 시각화 방법론 •비율의 시각화 예시
  • 40. 다양한 시각화 방식 데이터 시각화 방법론 •비율의 시각화 예시
  • 41. 다양한 시각화 방식 데이터 시각화 방법론 •x - y 관계로 나타내는 시각화 •산점도, 버블 차트 •밀도 등고선 •선 그래프
  • 42. 다양한 시각화 방식 데이터 시각화 방법론 •x - y 관계로 나타내는 시각화 예시 Hans Rosling (TED) The best stats you’ve ever seen Gapminder
  • 43. 다양한 시각화 방식 데이터 시각화 방법론 •x - y 관계로 나타내는 시각화 예시
  • 44. 다양한 시각화 방식 데이터 시각화 방법론 •x - y 관계로 나타내는 시각화 예시
  • 45. 다양한 시각화 방식 데이터 시각화 방법론 •x - y 관계로 나타내는 시각화 예시
  • 46. 다양한 시각화 방식 데이터 시각화 방법론 •x - y 관계로 나타내는 시각화예시
  • 47. 다양한 시각화 방식 데이터 시각화 방법론 •x - y 관계로 나타내는 시각화 예시
  • 48. 다양한 시각화 방식 데이터 시각화 방법론 •x - y 관계로 나타내는 시각화 예시 63.27 49.57 31.13 18.27 -37.63 (-)45 (-)55
  • 49. 다양한 시각화 방식 데이터 시각화 방법론 •x - y 관계로 나타내는 시각화 예시
  • 50. 다양한 시각화 방식 데이터 시각화 방법론 •지리공간 데이터의 시각화 •지도 •단계구분도 •카토그램
  • 51. 다양한 시각화 방식 데이터 시각화 방법론 •지리공간 데이터의 시각화 예시
  • 52. 다양한 시각화 방식 데이터 시각화 방법론 •지리공간 데이터의 시각화 예시
  • 53. 다양한 시각화 방식 데이터 시각화 방법론 •지리공간 데이터의 시각화 예시
  • 54. 다양한 시각화 방식 데이터 시각화 방법론 •지리공간 데이터의 시각화 예시
  • 55. 다양한 시각화 방식 데이터 시각화 방법론 •불확실성의 시각화 •오차 막대 •눈 모양 도표 •신뢰 대역
  • 56. 다양한 시각화 방식 데이터 시각화 방법론 •불확실성의 시각화 예시
  • 58. 나폴레옹 진군 맵 데이터 시각화 사례 •나폴레옹 군대의 출정과 복귀
  • 59. 1854년 Broad가의 콜레라 발병 맵 데이터 시각화 사례 •콜레라 발병 원인 파악 및 해결책 제시
  • 60. 크림 전쟁 당시 사망 원인 데이터 시각화 사례 •나이팅 게일 - 사망 원인 분석
  • 61. Next America 데이터 시각화 사례 •미국 인구 통계 데이터 시각화 •향후 예상되는 인구 통계적 변동과 변화를 추측 •인터랙티브 시각화를 통해 긴 시간의 변화를 명확히 전달
  • 62. 생존자 편향의 오류 데이터 시각화 사례 •2차 세계대전 미군 전투기 외상 시각화
  • 63. Google & Naver Trend 데이터 시각화 사례 •검색어 트렌드 확인
  • 64. NAME Chart 데이터 시각화 사례 •아기 이름 데이터 시각화 대법원 전자가족관계등록시스템 활용
  • 65. 코로나19 데이터 시각화 사례 •코로나 확진자 이동 경로 시각화
  • 66. SKT 2020 지하철 리포트 데이터 시각화 사례 •통신 데이터를 활용한 지하철 이용 패턴 및 코로나19 영향 분석
  • 67. SKT 2020 지하철 리포트 데이터 시각화 사례 •통신 데이터를 활용한 지하철 이용 패턴 및 코로나19 영향 분석
  • 68. SKT 2020 지하철 리포트 데이터 시각화 사례 •통신 데이터를 활용한 지하철 이용 패턴 및 코로나19 영향 분석
  • 69. 사례 사이트 모음 • Information is beautiful • https://informationisbeautiful.net/ • SBS 마부작침 • http://news.sbs.co.kr/news/mabuList.do • KBS 데이터룸 • http://news.kbs.co.kr/news/list.do?mcd=0909&ref=pMenu#1 • 중앙일보 데이터 브루 • https://databrew.joins.com/deepbrew • 한국경제 뉴스래빗 데이터랩 • http://newslabit.hankyung.com/list/groups/datalab • TangibleVitz • https://www.tangiblevitz.com/data-storytelling • howmuch.net • https://howmuch.net/ • 한국데이터산업진흥원 - 데이터 안심구역 • http://datakorea.datastore.or.kr/
  • 71. MS Excel 데이터 시각화 도구 •가장 쉽고 일반적으로 사용 가능한 도구 •한계가 명확 •확장성 부족
  • 72. MS Power BI 데이터 시각화 도구 •Excel에서 불가능한 대용량 파일 처리 •Tableau와 유사 •웹에서 사용 가능 •윈도우 전용
  • 73. Tableau 데이터 시각화 도구 •대시보드 목적의 도구 •사용자(기업) 증가 •많은 기능을 쉽게 사용 가능 But, 유료…
  • 75. Matplotlib 데이터 시각화 도구 •파이썬의 가장 기본적인 시각화 라이브러리 •Pandas와 연계하여 쉽게 시각화 가능
  • 76. Seaborn 데이터 시각화 도구 •matplotlib 기반으로 다양한 색 테마, 차트 기능을 추가한 라이브러리 •matplotlib에 의존 •matplotlib에 없는 그래프(히트맵, 카운트플랏 등) 포함
  • 77. Bokeh 데이터 시각화 도구 •웹 최적화 인터랙티브 시각화 라이브러리 •통계 분석 외에도 임의의 데이터 시각화를 지원 •시각화의 요소들을 직접 조절 가능
  • 78. D3.js 데이터 시각화 도구 •Data-Driven Documents . JavaScript •데이터 중심의 문서의 약자로 자바스크립트 기반 라이브러리 •사용자가 입력한 시각화 규칙을 바탕으로 데이터를 반영해 시각화 생성 •plotly도 d3.js를 사용하여 시각화
  • 79. Folium 데이터 시각화 도구 •지도 데이터(Open Street Map) 위치정보를 시각화하는 라이브러리 •자바스크립트 기반으로 인터랙티브 지도 생성 •그 외 pydeck, ipyleaflet 등으로 지도 시각화 가능
  • 81. 파이썬이란? 파이썬이란? •가장 인기있는 프로그래밍 언어 중 하나이다. •웹페이지개발, 데이터 분석, 인공지능 등 많은 영역에서 활용된다. •오픈 소스로 무료로 이용가능하다 세계 프로그래밍 언어 인기 순위
  • 82. 파이썬의 장단점 파이썬이란? 장점 - 문법이 쉬워 쉽게 배울 수 있다. - 코드를 이해하기 쉽고 수정이 간단하다. - 데이터분석 및 시각화와 관련된 패키지들이 잘 구성되어있다. 단점 -C, Java등에 비해 속도가 느리다. -동시다발적인 연산을 하는데 적합하지 않다. "hello world"를 프린트하기위한 코드 Java vs Python 프로그램 언어별 연산 속도 (값이 클수록 오래걸림)
  • 83. 파이썬으로 할수 있는 것들 파이썬이란? 단순 계산 그래프 그리기 게임 만들기 데이터 분석 및 시각화Mathematics
  • 84. Plotly란? •파이썬에서 데이터를 시각화하기 위해서는 matplotlib, seaborn, plotly등 시각화 라이브러리를 이용해야한다. •Plotly는 파이썬의 시각화 라이브러리중 하나로 산점도, 막대그래프, 파이차트, 지도 등 다양한 시각화를 데이터를 이용해 구현할 수 있다.
  • 85. Plotly 의 특징 plotly란? •plotly.express - 간단한 코드로 효과적인 시각화를 할 수 있는 모듈 •plotly.graph_objects - 비교적 복잡한 코드를 이용해 세세한 설정을 지원하는 모듈 •크게 두가지 성격의 모듈이 있어 필요한 상황에 따라 효율적으로 데이터 시각화를 할 수 있다. plotly.express(px) plotly.graph_objects(go)
  • 86. Plotly의 장점 Plotly란? •plotly의 가장 큰 장점은 interactive한 시각화가 가능하다는 점이다. 마우스를 이용해 개별 데이터값 확인 가능 원하는 데이터의 범위 설정 가능
  • 88. 참고 • Fundamentals of Data Visualization, Claus O. Wilke • 데이터시각화 이해하기 #1 데이터 시각화란? • https://visualize.tistory.com/112 • 당신도 데이터 시각화를 해야 하는 5가지 이유 • http://www.bloter.net/archives/329334 • Anscombe's’ Quartet simulation • https://www.autodeskresearch.com/publications/samestats • 생존자 편항의 오류 • https://www.andrewahn.co/silicon-valley/survivorship-bias/ • Python에서 데이터 시각화하는 다양한 방법 • https://zzsza.github.io/development/2018/08/24/data-visualization-in-python/ • Seaborn vs Bokeh. Part 2. Bokeh tutorial • https://lovit.github.io/visualization/2019/11/22/bokeh_tutorial/ • D3.js 란? • https://velog.io/@smooth97/-Data-Visualizing-D3.js-%EB%9E%80 • 세계프로그래밍언어 순위 • https://ifuwanna.tistory.com/203 • 파이썬의 장단점 • http://www.itworld.co.kr/print/92103