O slideshow foi denunciado.
Seu SlideShare está sendo baixado. ×

코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)

Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Anúncio
Carregando em…3
×

Confira estes a seguir

1 de 44 Anúncio

Mais Conteúdo rRelacionado

Semelhante a 코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어) (20)

Mais recentes (20)

Anúncio

코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)

  1. 1. 강태영 (minvv23@underscore.kr) 코로나 이후, 반중 정서는 과연 심화되었을까? : 뉴스 포털 댓글 데이터를 활용한 온라인 여론 변화 분석 2021.12.18. <팬데믹 시대의 혐오>
  2. 2. Curriculum Vitae 강태영 minvv23@underscore.kr Education 2019.03-2020.08. M.S. 경영공학 (KAIST) 2014.03.-2019.02 B.A. 사회학/정치학 (서강대학교) Job & Activities 〮 2018.04.- 데이터 분석 & 미디어 컨텐츠 스타트업 <언더스코어> 〮 2020.09.- KAIST D.LAB Visiting Researcher 〮 2021.04.- MyMusicTaste Data Analyst 〮 2020.10.- KoreaPDS Statistician Research Interest 〮 전산사회과학 (Computational Social Science) - 온라인 미디어에서의 여론 형성과 유저 의사 결정 - 데이터 기반 인사(HR) 관리 〮 양적연구방법론 (Quantitative Research Methodology) - 자연어처리 응용 연구 - 온라인 데이터 유저 텍스트 분석
  3. 3. Introduction
  4. 4. Introduction
  5. 5. Introduction
  6. 6. Introduction
  7. 7. Introduction
  8. 8. Introduction
  9. 9. 연구의 목적
  10. 10. Research Questions 코로나 이후 반중(反中) 혐오발언은 증가했는가? 코로나 이전의 인종·국가 혐오 발화의 추세는 어떠했는가? 반중(反中) 혐오발언과 개인의 정치 성향의 관계는 어떠한가?
  11. 11. 데이터와 방법론
  12. 12. Data & Methods 시간 혐오발언
  13. 13. Data & Methods 시간 혐오발언
  14. 14. Data & Methods 시간 혐오발언
  15. 15. Data & Methods 시간 혐오발언
  16. 16. Data & Methods 시간 혐오발언 이중차분 Difference-in-Differences
  17. 17. Data & Methods 기간 2011.01.01.-2021.11.01. 수집 대상 주요 언론사 64곳 검색어 중국, 일본, 中, 日, 한중, 한일
  18. 18. Data & Methods 다음 뉴스 크롤러 - 제목 - 언론사 - 댓글 네이버 뉴스 크롤러 - 제목 - 언론사 - 댓글 네이버 검색 API 1-1. BigKinds 뉴스 제목으로 검색 1-2. 다음 뉴스 제목으로 검색 2. 네이버 뉴스 크롤러 사용 다음 검색 API 1. BigKinds 뉴스 제목으로 검색 2. 다음 뉴스 크롤러 사용 BigKinds 뉴스DB 최종 데이터 (35,536개 뉴스) - BigKinds 뉴스 제목 - 네이버 뉴스 제목 - 네이버 뉴스 댓글 - 다음 뉴스 제목 - 다음 뉴스 댓글
  19. 19. Data & Methods
  20. 20. Data & Methods - 1,001,021건의 댓글 데이터를 모두 수집 - 네이버와 다음 각 포털에서 각각 약 2,000명 씩 총 3,802명의 유저 패널을 확보 - 중국과 일본 각각에 대해 최소 5회 씩은 댓글을 작성한 2,996명 패널을 최종 활용
  21. 21. Data & Methods 워드클라우드
  22. 22. Data & Methods 텍스트 네트워크 분석 워드클라우드
  23. 23. Data & Methods 왜 문제인가? - 단순히 오래되어서가 아니라 ‘잘못된 방식’이어서 문제 - 언어가 표현(representation) 되는 방식을 적절히 보여주지 못하는 방법 - 어휘의 사용 빈도가 특정 문서의 언어적 특징들을 충분히 설명할 수 있는가? - 어휘들 간의 네트워크가 특정 문서가 언어적 특징들을 충분히 설명할 수 있는가? - 시각적으로 화려해(?) 보이기는 하니 효용감을 위해 자주 사용되고 있음 - 그러나 ‘해석‘이 실질적으로 불가능하기에 결국 분석가의 자의적인 해석이 분석/ 시각화의 결과와는 무관해지는 문제가 발생
  24. 24. Data & Methods
  25. 25. Data & Methods - 2019.01.-2021.07. 포털 뉴스 섹션 및 주요 온라인 커뮤니티에서 댓글 약 3.5만 건 수집 - 레이블링 완전 일치율 53.11% / 일관성 Krippendorff’s Alpha 0.713 - 분류 정확도(Label Ranking Average Precision) 0.914
  26. 26. Data & Methods #1 : 토큰 추출 #2 : 토큰 평균 임베딩 #3 : 문서 클러스터링
  27. 27. Data & Methods Sentence A Sentence B Pooling Pooling u v (u, v, |u-v|) Classification Layer Sentence BERT
  28. 28. 분석 결과
  29. 29. Empirical Analysis
  30. 30. Empirical Analysis
  31. 31. Empirical Analysis
  32. 32. Empirical Analysis
  33. 33. 연구의 결론
  34. 34. Conclusion 통념과 달리, 코로나 이전에는 반중 발언의 증가 추세 관찰 X
  35. 35. Conclusion 판데믹을 거치며 본격적으로 반중 발언이 늘어나기 시작
  36. 36. Conclusion 반중 발언이 증가한 뉴스 주제들은 다양한 이슈를 포괄
  37. 37. Conclusion 보수 성향 유저일수록 반중 정서가 코로나 이후 더 급격히 증가
  38. 38. 연구의 의의
  39. 39. Data 추론통계 Inferential Statistics Implications 예측통계 Predictive Statistics
  40. 40. Data Inferential Statistics Predictive Statistics 인과분석 Causal Analysis 머신러닝/딥러닝 Machine Learning Implications
  41. 41. Implications 시간 혐오발언 이중차분 Difference-in-Differences
  42. 42. Implications
  43. 43. Implications
  44. 44. 감사합니다. 강태영 (minvv23@underscore.kr) 2021.12.18. <팬데믹 시대의 혐오> 컨퍼런스

×