9. Dataset
• 날씨 데이터
•
•
•
•
•
2009, 4월
http://www.wunderground.com
Web crawling
미국의 각 weather station의 날씨 정보들
각 state에 해당하는 weather station들의
날씨 정보 mapping
source: http://www.wunderground.com
2013-10-29
GCT606 Digital Performance
9
12. Approach
• 감성 분석
• LIWC (Linguistic Inquiry and Word Count)
• 긍/부정 감정 제공
• 지역별, 날짜별 평균값 분석
2013-10-29
GCT606 Digital Performance
12
13. Approach
• 상관관계 분석
• 피어슨 상관계수 이용 (Pearson’s r )
• -1 < r < 1
• r 값이 0에 가까우면 둘 간에 관계가 없고, 1에 가까울수록 양의 상관관계가, -1에 가
까울수록 음의 상관관계가 있다.
• 날씨의 변화와 감정의 변화는 어떤 관계가 있는가?
• 예) 온도가 올라갈때 긍정 감정이 같이 올라가는 경향이 있다. r > 0.4
2013-10-29
GCT606 Digital Performance
13
15. Result
• 월 평균 기온 <-> 월평균 긍정 감정
-> 평균 기온이 높은 곳에 살 수록, 긍정적인 경향이 있다.
(r =0.3752)
2013-10-29
GCT606 Digital Performance
15
16. Result
• 일 평균 기온 <-> 일평균 긍정 감정 (주별로)
=> (각각의 여러 주 별로) 일 평균 기온이 높을 수록 긍정 감정도 높은 경향
이 있다. 하지만 그 반대의 경향을 보이는 주도 있다.
2013-10-29
GCT606 Digital Performance
16
17. Result
• 일 평균 습도 <-> 일평균 부정 감정 (주별로)
=> (각각의 여러 주 별로) 일 평균 습도가 높을 수록 부정 감정도 높은 경향
이 있다. 하지만 그 반대의 경향을 보이는 주도 있다.
2013-10-29
GCT606 Digital Performance
17
18. Result
• 일 평균 기압 <-> 일평균 긍정 감정 (주별로)
=> (각각의 여러 주 별로) 일 평균 기압이 높을 수록 긍정 감정도 높은 경향
이 있다. 하지만 그 반대의 경향을 보이는 주도 있다.
2013-10-29
GCT606 Digital Performance
18