19대 총선보도와 웹보메트릭스 활용
 -받아쓰기’에서 ‘데이터’ 저널리즘으로
                     박한우 교수
                   영남대 언론정보학과

                대구경북 소셜미디어 포럼

총선보도의 원칙, 언론사의 현실은?
   선거 취재의 중요한 2개 원칙
-   공정성 (Fairness): 기계적 공정성
-   객관성 (Objectiveness): 사실에 기반한 보도

   독자는 „신속‟하고 „흥미로운‟ 기사를 요구함
-   인터넷 포털, 소셜미디어, 모바일로 넘어간 고객들

•   공정성/객관성 과 신속성/흥미성의 공통분모는??
-   과학적 방법에 기반한 주관성의 극복!
How American people learn about their
local politics, campaigns and elections?

   Adults age 40 and older are more likely to prefer
    word of mouth as a source for local politics, local
    government activity, housing and real estate, zoning,
    and social services.

   Source: (2011)
사회과학/언론정보학 연구방법에 대한 제고
   인터넷 기술의 발전과 보급으로 인한 사회 현상의 변
    화 양상은 사회과학자들에게 새로운 연구 방법에 대
    한 도입의 필요성을 인식시킴.

       웹공간(Webosphere)에 있는 무한한 정보들을 어떻게 정
        제(수집 및 가공)할 것인가?
       엄청난 규모의 자료를 어떻게 분석 처리할 것인가?

   자료중심적(data-intensive) 방법론에 대한 관심 증대
       자료의 수집, 저장, 가공, 분석 등에 대한 인식 전환
       수단  목적
   웹보메트릭스는 월드와이드웹(World Wide Web)의 „웹(Web)‟
    과 계량적 분석을 뜻하는 „메트릭스(Metrics)가 합성된 용어로,
    인터넷 정보와 디지털 기술의 사용방식을 정량적으로 분석하는
   웹보메트릭스라는 이름은 Almin와 Ingwersen(1997)의 논문에
    서 비롯되었다. 그렇지만, 웹보메트릭스 분야는 하이퍼링크 네
    트워크, 웹 가시성 추적, 블로그 관계망, 검색엔진 비교 분석을
    포함하면서 사회정보학을 벗어나 급속히 확대되고 있음.
   특히, 웹보메트릭스 연구방법은 웹사이트의 콘텐츠와 하이퍼링
    크 등을 통한 사회네트워크분석(social network analysis)에 자
    주 활용되고 있음.
주요 e-리서치 도구 (사업단 자체 개발)

   한국의 대표적인 포털사이
    트인 “네이버”와 “다음”을 이
    용한 Open API(Application
    Programming Interface)기
    반 자동 검색 프로그램.

   블로그, 온라인 커뮤니티,
    지식인, 웹게시판, 이미지,
    동영상 등 다양한 인터넷 플
    랫폼들에 따른 검색 결과를
    자동으로 수집하며, 방대한
    양의 웹사이트 주소(URL)
    및 문서 내용 등을 자동으로
데이터의 홍수, 저널리즘의 위기인가??
• 데이터의 홍수는 분석도구의 개발을 가져옴
• visualization 분야의 연구자들이 비전문가를 도와줌
• Journalists도 데이터 갖고 스토리 만드는 방법에 적응
• 차트 만들기에서 infographics designers의 도움으로
  데이터를 „탐사저널리즘‟의 개념간 설명에 사용함
• 데이터 저널리즘을 잘 구현한 기사는 소셜 미디어 공
  간에서 일반 개인들이 인용하는 인기콘텐츠로 바뀜

해답: 웹보메트릭스를 활용한 데이터저널리즘(DJ) !!!
      바탕으로 재구성
From the News Cycle
      to the Political Information Cycle
But there is an important distinction to be made
 between homogeneity of content across outlets
 and homogeneity across platforms. Few would
 dispute that homogeneity of content across
 outlets is a threat to pluralist understandings of
 media and politics.
But in an increasingly fragmented media
 environment, in which growing segments of the
 audience are turning away from traditional
 platforms, particularly the printed Britain‟s First
 Live Televised Party Leaders‟ Debate, should we
 be so quick to denigrate content duplication
 across platforms?
From the News Cycle
    to the Political Information Cycle
Political information cycles are partly dependent upon cross
 platform iteration and recursion. These processes
 increase the likelihood that multiple, fragmented
 audiences will be exposed to political content and they
 arguably loosen the grip of journalistic and political elites
 by creating opportunity structures with greater scope for
 timely intervention by citizen activists.
Homogeneity across platforms can thus fashion a form of
 unifying „publicness‟ that has long been presented as
 withered due to media fragmentation. It should also be
 borne in mind that the creative practices of online mark-
 up culture, including editing, remixing and satirical
 commentary, by both elites and non-elites, are important
 features of the political information cycle.
Data journalism 개념
   Precision journalism VS Investigative journalism
   Computer Aided Journalism/Reporting (CAR)
   Journalism 2.0
   Open journalism
   Infographics journalism
   Interactive journalism
   Multimedia journalism
   Location-based journalism
   Social media journalism
„Agenda Weaving‟으로 더욱 주목받는 DJ !!
   기존매체이든 새로 부상하는 소셜 미디어든 „의제
    설정자(agenda setter)‟로서의 기능을 갖고 있지만,
    오히려 두 미디어의 역할은 의제의 발원지에
    상관없이 의제의 중요성에 관해 토론하고 서로의
    컨텐트를 게이트키핑하는 “의제 뜨개질바늘(agenda
    weaver)”로 전환되고 있다고 볼 수 있다.

-   김장현, 미국 하와이대 교수
데이터 저널리즘은 벌써 시작되었다!

   유명 블로거의 영향력 > 기존 언론

-   Andrew Sullivan
-   알래스카 기후연구소 자료의 검토를 통해
-   New York Times의 알래스카 평균 기온이 지난
    30년동안 화씨 7도 상승 기사는 오보
-   편집인과 편집국장 사임
-   실제 상승온도는 5.4도
TED 강의 듣기

         열번째 강의

         James Surowiecki가 말하는 소셜 미디어의 전환점


                                 James Surowiecki는 소셜미디어가
                                 이제 뉴스 유통에서 기존의 미디어
                                 와 동등한 역할을 하게 되었음을 지
                                 적합니다: 2005년에 일어난 쓰나미
                                 재해, 바로 그때 유튜브 비디오, 블
                                 로그, 인스턴트 메신저, 그리고
                                 SMS등을 통해 빠르게 재난소식이
                                 전달됐으며 비극으로부터 감동적인
                                 개인의 이야기들이 세상에 알려 질
                                 수 있었습니다.

인터넷 윤리                                                      18
윌리엄 깁슨 Zero History(2010)에서 트위터 How about Twitter? More than most authors
I‟ve checked out, your tweet-happy avatar @GreatDismal
seems to be most comfortable messaging and cool-
hunting on the service. And in the novel, Twitter‟s
consistently used as a communication and parenting
device, depending on the spook.
Gibson: Well, I discovered Twitter while I was writing the
novel, and I immediately saw its odd potential for being a
tiny, private darknet that no one else can access. I‟m
always interested in the spooky repurposing of everyday
things. After a few days on Twitter, what was most
evident to me is that, if you set it up right, it‟s probably
the most powerful novelty aggregator that has ever
existed.                                                       Zero History, 2010
특정 이슈에 대한 트윗
      자료의 예측성을 보여
      주는 지표

아래 그래프는 날짜별 ‘구제역’ 언급 트윗
메시지 개수 (
4월 17일 구제역 관련 기사와 함께 이용자
들이 민감하게 반응하고 있음을 확인할 수

가상공간의 정보수집:
‘CNN’SL iReports 서비스
동아일보: 데이터저널리즘 능동적 활용
동아일보: 데이터저널리즘 능동적 활용
Data journalism - PANDA will help find
context and relationship between data
   Niemanlab :: News organizations, almost by their
    nature, have tons of data, from Census numbers and
    campaign finance reports to DWI records and
    housing prices and PANDA wants to give all that info
    a home where it can be easily accessed. PANDA, a
    winner of this year‟s Knight News Challenge, is
    what developer Brian Boyer,the news applications
    editor at the Chicago Tribune, calls a “newsroom
    data application,” a tool that helps find context and
    relationships on the fly. It will take one year to set up
    the open source platform.
   Continue to read Justin Ellis,
First hand - how the New York Times
used Twitter to curate election news
   New York Times :: Nice experience report of the New
    York Times, how they used Twitter to collect information.
    - For the 2010 election, the New York Times built a
    continuously updated election guide that let readers
    explore data related to each of the 509 congressional
    and gubernatorial races.
   After adding candidate information, race ratings, polls,
    election forecasts, campaign finance numbers and
    historical election results, NYT's staff wanted a way for
    our political reporters to contribute live updates. They
    imagined them writing short news items and finding links
    to related stories from The New York Times and other
    sources, so that each page would reflect the most recent
    developments in that contest.
   First hand experience - continue to read Andrei
웹보메트릭스를 활용한 데이터저널리즘 장
   유력 정치인의 „한마디‟를 듣기 위해 온갖 노력을 마다
    않는 언론의 정치 취재 관행은

-   비용이 많이 듦,
-   그것이 아니면 정치의 메커니즘을 제대로 보여줄 도
    구가 없는 것인가???

                 html?idxno=9661                          31
웹보메트릭스를 활용한 데이터저널리즘 장
   정치 네트워크 분석: 유력한 대안이 될 전망
-   객관적 실험이 불가능한 사회과학의 한계와 자기 정
    보를 감추는 정치인의 성향 때문에, 정치에 대한 국민
    의 알 권리는 제대로 충족되지 못했던 경향이 있다.
-   네트워크 분석은 그런 한계를 넘어 객관적이고 눈에
    보이는 형태로 정치를 이해하게 해 준다.

 정치인과 대중 간의 네트워크를 분석하면
- 정치인의 메시지가 어떻게 확산되고 누가 확산시키는
  지를 네트워크 분석으로 보면, 정치인의 영향력이 어
  떤 경로로 전파되는지, 로비단체나 이른바 „알바‟의 실
  체가 어느 정도인지도 드러날 수 있다

2012. 4. 11. 제19대 국회의원선거일정

        시행일정                   실시사항

        12.13부터   예비후보자 등록
                  의정활동 보고 금지

        1.12까지    입후보제한을 받는 자의 사직

        2.11부터    지방자치단체장의 선거에 영향을 미치는 행위 금
        4.11까지    지
        3.27부터    후보자등록 신청
        3.28까지    (매일 오전9시 ~ 오후5시까지)
                  부재자투표소 투표
                  투 표 (오전6시 ~ 오후6시까지)
                  개 표 (투표종료후 즉시)
                  기탁금 반환 및 공제명세서 송부
                  정치자금 회계보고서등 제출

        6.8까지     선거비용 보전
19대 총선보도 적용: 예비후보자들의 인맥관계
                  동시에 언급된
                  빈도 조사하기
e-리서치 도구의 활용: 웹가시성 분석
   웹가시성(Web Visibility)은 인터넷 이용자들(공중)이
    온라인 공간에서 주목하고 있는 행위자, 사건 또는 이
    슈들의 현존성을 의미 (Ackland, Gibson, Lusoli, &
    Ward, 2010; Gauvin, 2010).
홈페이지로부터 유용한 하이퍼링크 찾아내기
Connecting: Endorsement
누가 누가 나오면 엔트로피가 많이 생산될까?
 Politician (A B C)    A      B         C       AB        AC        BC        ABC
 Na, Won, Noh         18000       377   16000    898       118           50      32
 Na, Won, Kang        16000       380    4438    898            1         1         1
 Na, Won, Chung       16000       357   14000    898           63        68         1
 Na, Noh, Kang        18000   15000      3817    118            1    571            0
 Na, Noh, Chung       16000   14000     13000    118           63    737            0
 Na, Kang, Chung      15000    3618     13000         1        63    280            1
 Won, Noh, Kang        9208   19000     10000        50         1    571            0
 Won, Noh, Chung       8353   18000     27000        50        68    737            1
 Won, Kang, Chung      8154   10000     28000         1        68    280            1
 No, Kang, Chung      18000    9224     27000    571       737       280        151

출처: Measuring Twitter-Based Political Participation and Deliberation in th
e South Korean Context by Using Social Network and Triple Helix Indicator
A comparison of trilateral relationships
of five politicians on Twitter
Measuring Twitter-based political
participation by using TH indicators
   The absolute entropy values were lower when the
    trilateral relationship included the two conservative
    politicians: Na and Won. As indicated earlier, the lower
    the entropy value, the less stable the communication
    system is. Thus, the communication system became
    more unbalanced in trilateral relationships that included
    the two conservative politicians. On the other hand, in
    those trilateral relationships including only one
    conservative politician, the entropy values were higher,
    and the communication system was more stable. These
    results suggest that the level of political deliberation,
    expressed in terms of the degree of stability in the
    communication system, increases when politicians with
    different political orientations form trilateral relationships
19대 총선보도 적용: 후보 공천 이후
   실시간 모니터링 기법을 통한 시계열적인 변화 추세 분석
e-리서치 도구의 활용: 웹가시성 분석
   블로그 공간에서 후보자들의 웹가시성 수준과 득표 수간
    에 밀접한 상관성을 나타냄. (임연수, 박한우, 2010,
                                       실제 득표수
      평균 블로그 수



                                       3,071 2,125

                     경대수 정범구 정원헌 박기수 이태희 김경회
트위터 데이터로 4.27 재·보궐선거 예측한
“빵 만드는 웹기획자”

            분석 기간: 2011년 4월 20일 수요일~2011년 4월 28일 목요일
            소스 출처: 트윗트렌드(

            Education Superintendents VS Mayors

            Education Superintendents VS Mayors

            Education Superintendents VS Mayors

            Education Superintendents VS Mayors

            Education Superintendents VS Mayors

            Education Superintendents VS Mayors

            Education Superintendents VS Mayors

            Education Superintendents VS Mayors

            Education Superintendents VS Mayors
Result - 1



             Time ICA 24th May to 2nd June)
      Web Ecology - 2011
                         (from      5/29/2011
Link(2010_M) Link(2010_E)   Link(2007_P)
  Date                                                   Date
                N=44         N=69           N=20
24-May-10       3.77         0.03

25-May-10       3.82         0.04

26-May-10       3.86         0.04

27-May-10       3.77         0.11         869.66       02-Dec-07

28-May-10       3.62         0.15         785.52       05-Dec-07

30-May-10       3.87         0.63         877.92       08-Dec-07

31-May-10       3.92         0.92         940.58       11-Dec-07

01-Jun-10       4.03         1.24         819.72       14-Dec-07

02-Jun-10       4.10         1.36         1129.62      17-Dec-07
Results - 3


                           ○Grand National Party
                           ●Democratic Party
                           ■Participation Party
                           ◆Liberty Forward Part
                           ▲ New Progressive Pa

                           Educational superinten

                           ▲Non-Seoul metropolit
                           an Area
  Web Ecology - 2011 ICA   ●Seoul metropolitan Ar
Results - 5

  Web Ecology - 2011 ICA   5/29/2011
(대통령 후보 경선에서) 이명박-박근혜 접전
-국제저널인 IS(International Sociology)에 발표한 논문, Lee & Park(2010)

 웹보메트릭스 방법론을 통해서 표면적으로 드러나지 않는 경쟁구도 파악 가능
사이버공간에 나타난 한나라당 내부 갈등 구조

                                  분석대상의 수(N) = 901
                                                    (이명박: 215)
                                                    (박근혜: 692)
                                                    (공동: 6)

                   이명박과 박근혜 후보의 사이버 인맥지도: 경선기간 링크구조
               국제저널인 IS(International Sociology) 발표한 논문, Lee & Park(2010)
Changes of co-link networks during
2007 presidential campaign period
  Web-mentions of candidate & party names,
   website sizes, visitor traffics, inlink counts, and
   co-links were collected in seven times
 3-day interval, 29 Nov - 17 Dec in 2008
 Particular usefulness of webometrics survey
   during Korean presidential campaign period
- Public survey can be reported only 3-day before
   the election
- In 2003 presidential election, it used to be 22-day
Changes of co-link networks during
presidential campaign period

                              2 Dec 2007
11 Dec 2007
17 Dec 2007
    D-1 day
Summary of findings
 Online attention focused on major
  parties/candidates cf. Moon GH, Huh KY
 Frequency counts, Web traffic:
  the (conservative) GNP > the liberals
 Incoming links, size of the site:
  the liberals & labor candidates > the GNP
 Co-link maps
= indicative of the relative level of public awareness
  and the ideological orientation of candidates
= a third-person perspective
* 후보자들간 텔레비전 토론보도의 경우

쇠고기 수입 반대에 나타난 갈등메커니즘
- 텔레비전 토론회의 ‘의미 네트워크 분석’
네트워크 그림 확대
정부 측 의견

중립적이고 포괄적인

단어 사용을 통해

관련 정보를 전달
시민단체 측 의견

            자신들의 주장을

            드러내는 보다

            구체적인 용어를

집회에 상반된 인식

Online mapping tools in the newsroom

   Scribblemaps
   ManyEyes http://www-
   Mobile tools
   iPhone challenge
   오늘날 인터넷으로 비롯된 디지털 네트워크 사회에
    대한 과학적 탐구를 위해서는 자료중심적 방법론의
    개발 및 활용이 필요.
   이를 위해서는 다학제(Multidisciplinary)간 융합연구
    가 절대적으로 필요한 시점임.

                             Source: Arzberger et
                             al., 2004a, p.1777
Prof. Han Woo PARK
                                  World Class University Webometrics Institute
                                  CyberEmotions Research Center
                                  Department of Media and Communincation,
                                  YeungNam University, Korea


Mais conteúdo relacionado

