SlideShare uma empresa Scribd logo
1 de 38
Baixar para ler offline
제안배경-웹2.0 & 집단지능& SNS etc… 
제안서(초안) 
작성자: 민병국(2008.4.30)
검색: 쿼리가가리키는문서위치제어 
사용자쿼리 
문서셋(콜렉션) 
쿼리와문서를1:1로직접연결 
쿼리를여과없이반영: 수동적인검색 
1 
2 
3 
역색인파일을여과없이적용: 단순필터링과스코어링 
[제안서] 주제검색과 오픈검색 - 민병국 2
현재의검색기술 
 
90년대부터디스크가격이낮아지면서현실화 
 
빠른속도의String Search를위해Text에서검색대상이되는String(단어)를추출하고위치를기록 
 
Text 원문대비80% ~ 400% 수준의역색인구축 
 
Ranking 모델 
 
다양한통계적모델이제시됨 
 
Online update 처리 
 
실시간문서추가, 삭제, 변경 
키워드기반검색엔진으로부터탈피 
• 
Question Answering 
• 
Classification 
• 
Summarization 
• 
Recommender Systems 
• 
Cross Language IR 
• 
Information Extraction 
• 
Topic Detection & Tracking 
• 
정보공유의필요성 
• 
분류된정보의필요성 
• 
양질의정보의정렬의필요성 
• 
더정확한결과의필요성 
변화 
의미검색으로의확장 
[제안서] 주제검색과 오픈검색 - 민병국 3
능동적인검색: 모델링, 전처리 
사용자쿼리 
문서 
문서모델링: 연관검색어, 쿼리확장등.. 
쿼리모델링: Clustering, MI, Categorization 등.. 
+ 
의미사전 
의미색인(Semantic Indexing) or언어모델링(Language Modeling) 
[제안서] 주제검색과 오픈검색 - 민병국 4
SNS (Social Network Service) 
 
정의 
 
사회적관계개념을인터넷공간으로가져와사람과사람간의관계맺기를통해네트워크형성을지원하며개인의일상사나관심사를공유/소통시켜주는서비스 
 
같은취미나생각을가진사람들끼리네트워크가형성되면단기간내에폭발적으로확대될수있어포털사이트들의새로운수익모델로자리잡아가고있음 
 
종류 
 
블로그형: FriendStar(2002), MySpace(2003) 
 
오픈형: Facebook(2004) 
 
폐쇄형: Mixi(미쿠시,일본), YUCASEE(일본) 
 
니치형: Dogster, Catster, Boompa, Farmster, TotJot, Traineo, Daum Cafe 
 
매칭형: Linkedln(미국), Ecademy(영국) 
 
영상중심형: YouTube(2005,캐나다) 
 
검색중심형: Eurekster 
[제안서] 주제검색과 오픈검색 - 민병국 5
Social Network와FOAF 
 
소셜네트워크에서온톨로지필요성 
 
온톨로지기술을활용하여웹인프라로써구축가능 
 
사람들은FOAF와같은온톨로지를통해다양한사람들과손쉽게연결될수있음 
 
친구의친구(FOAF: Friend Of A Friend) 
 
친구를통해친구를만들어가는인간관계를RDF로표현한온톨로지 
 
‘A가B를알고있다’-> ‘foaf:knows’라는속성으로표현 
 
FOAF에표현된개인정보와간단한Social Network 정보는FOAF를지원하는시스템을통하여다른FOAF 문서에연결될수있음 
 
FOAF가자신의홈페이지에RSS와같은방식으로공개되면다른사용자가이를참조할수있는데, 이를통해연결성이확장될수있음 
 
직장, 학교, People You Know 항목등.. 
foaf:knows 
foaf:knows 
foaf:knows 
foaf:knows 
foaf:knows 
foaf:knows 
foaf:knows 
foaf:knows 
[제안서] 주제검색과 오픈검색 - 민병국 6
집단지성(Collective Intelligence) 
 
정의 
 
다수의개체들이서로협력혹은경쟁을통하여얻게되는지적능력에의한결과로얻어진집단적능력 
 
집단지능, 협업지성, 공생적지능이라고도함 
 
활용예 
 
위키백과(Wikipedia) 
 
크라우드소싱 
 
롱테일경제원리를바탕으로한다양한지식비지니스에서효율성향상을위해크라우드소싱을통해집단지성을활용하고있음 
 
지능형음악서비스 
 
사이버음악동호회, 음악포털, 블로그홈페이지등으로부터사용자상황따라맞춤형음악추천 
집단지성또는사회망에의한모델링 
쿼리 
문서 
(기분,날씨,이벤트등..) 
[제안서] 주제검색과 오픈검색 - 민병국 7
웹2.0 
 
웹2.0의특징(by 팀오라일리) 
 
플랫폼으로서의웹(The Web as Platform) 
 
집단지성(collective intelligence) 이용 
 
데이터는다음세대의인텔인사이드 
 
소프트웨어릴리즈주기의종말 
 
가벼운(Lightweight) 프로그래밍모델 
 
단일디바이스를넘어선소프트웨어 
 
풍부한사용자경험 
 
웹2.0 서비스모델의특징 
 
매쉬업(Mashup) 
 
대중(사용자)에의한분류방법:포크소노미(Folksonomy) 
 
롱테일(Long Tail) 
 
소셜네트워크서비스(SNS: social network service) 
 
CMS(Content Management System) 
 
퍼머링크(Permalink) = 고정링크 
 
마이크로포맷(microfomats) 
[제안서] 주제검색과 오픈검색 - 민병국 8
미래웹의형태들 
 
쉬운웹(EasyWeb) 
 
오프라인과괴리감이없는온라인서비스 
 
현재의웹2.0 방향 
 
밝은웹(BrightWeb) 
 
웹에오가는사람과그사람의행동이보이는웹 
 
검색과이동의개념변화, 분산형포털, n2n웹 
 
리얼웹(RealWeb) 
 
현재의검색사이트: 과거의문서를검색, 웹자체도정적웹 
 
실시간이강화되고개인자체가저장장치가되고아바타가되는웹 
 
아트만웹(AtmanWeb), 로밍웹(RoamingWeb) 
 
개인정보를가지고다니는로밍데이터시대, 커뮤니티가사람을따라움직이는로밍커뮤니티시대 
 
개인자체가웹의시작이자끝이되는웹, 개인이웹의한구성원이자전부인시대 
 
생물학적웹(BioWeb) 
 
스스로생성, 성장, 소멸하는웹, 웹안의웹 
[제안서] 주제검색과 오픈검색 - 민병국 9
분산네트워크 
게이트웨이 
 
메트카프의법칙(Metcalfe’s Law) 
 
네트워크의가치가사용자의수의제곱에비례(네트워크효과) 
 
웹에서의네트워크 
 
게이트웨이(Gateway): 구글, 야후, 네이버 
 
노드(Node): 이용자의최종목적지, 콘텐츠의공급자 
 
허브(Hub): 센터로서독자적인네트워크를형성할수있는플랫폼 
 
네트워크의생태계순환 
 
CP는무한히증식(open 개념에의한확장) 
 
Top-down 흐름에서상위는best 문서만다루면됨(신뢰성) 
허브 
허브 
허브 
노드 
노드 
노드 
노드 
노드 
노드 
노드 
노드 
노드 
노드 
노드 
노드 
[제안서] 주제검색과 오픈검색 - 민병국 10
주제검색및오픈검색-통합주제검색, 상세주제검색-Best 오픈검색 
제안서(초안) 
작성자: 민병국(2008.4.30)
검색과정: 질의주제질의어결과문서선별클릭평가재검색 
질의어‘방송사고’ 
질의주제‘xx 방송사고’ : 무슨일인데? 누가? 뭘? => 눈으로찾으라고? (0.5초) 안띄네.. => 비슷한것있군. 뭐지? 바로클릭! 
‘방송사고’ 관련문서모두검색-최근방송사고, 큰방송사고-날뻔한방송사고, 사고이후-방송국헤이?, 네티즌비난-중국,외국/ 동영상,다시보기-사고관련방송, 방송언어와사고방식-방송관련해아쉬움사고있음-사고관련법률등방송교재-주제별중복다수… 
쿼리선택=> 모름, 대충작성… 
[제안서] 주제검색과 오픈검색 - 민병국 12
질의주제와문서주제의매칭 
vs 
동상이몽?? 
 
시멘틱검색: 어떻게?? 
 
동의어, 유사어시소러스: 쿼리확장어(리콜확대,유사질의모으기) 
 
쿼리내연관단어: 방송사고->노출방송사고->야한영화, 일본야동(네티즌선택,재검색유발) 
 
문서의미클러스터링: 사용자질의주제와맞는가? How detail or How rough? 
질의의분포 
문서의분포 
[제안서] 주제검색과 오픈검색 - 민병국 13
통합검색스타일vs 시멘틱검색스타일 
… 
쿼리 
뉴스 
블로그 
카페 
웹 
통합검색 
시멘틱검색(?) 
뉴스 
블로그 
카페 
웹 
… 
경제 
사회 
문화 
정치 
… 
뉴스 
블로그 
카페 
웹 
웹 
뉴스 
웹 
뉴스 
뉴스 
웹 
블로그 
경제 
사회 
건강 
문화 
정치 
생활 
건강 
경제 
생활 
국제 
경제 
문화 
다음 
네이버 
큐로보 
구글 
[제안서] 주제검색과 오픈검색 - 민병국 14
제안의목적 
 
사용자가선택한주제로검색을집중하자!! 
=> 검색엔진이몽땅퍼다주는내용을보고선별하는것보다자신이선택한내용내에서선별하는즐거움을주자 
 
주제별리콜을높이자!! 
 
남들도많이찾는주제를빠짐없이보여주자(사회망,집단지능) 
 
관련주제도함께보여주어검색결과를이해시키고재쿼리를유도하자(수평적확장검색) 
 
주제별정확도를높이자!! (사용자편집검색, Back 기능필수) 
 
주제에대한집중도를높여만족도를높이자(결과내재검색, 휴지통) 
⇒ 
클러스터링보다훨씬효과적이고호응도가높을거라생각함 
 
사용자참여에의한검색결과를만들자!! 
=> 사용자편집검색을집단적으로축적하여사용할수있도록하자 
 
정말잘들어맞은검색결과를남들도이용하게하자!! 
 
주제별(키워드별) 검색결과블로그를만들어퍼나르기(축적, 평가) 
 
쿼리없이무작정눌러보기일경우태그를입력토록유도 
 
사용자들이검색결과를만들어보도록하자!!(Wiki 스타일) 
 
주제별(키워드별) 검색결과블로그의내용추가/정렬할환경제공 
[제안서] 주제검색과 오픈검색 - 민병국 15
다양한주제의군집검색결과 
[제안서] 주제검색과 오픈검색 - 민병국 16 
 
다양한주제제시 
 
Logtail을제외한찾고자하는주제는거의다나옴 
 
찾고자하는주제에대한네비게이션기능수행 
 
검색결과를잡지보듯이읽게함 
사용자recall 향상 
 
같은주제의결과군집 
 
관심주제에대해서만나올거라는, 관련성있는문서만나올거라는신뢰감형성 
 
주제내검색에대한Zoom In/Out 기능 
Scatter & Gather 기능
검색결과의클러스터링 
 
같은내용별로묶어서, 중복은딸린링크로출력 
 
문서의임의적클러스터링결과는사람이이해하기어려움 
[제안서] 주제검색과 오픈검색 - 민병국 17
Daum의관련/확장검색어 
 
쿼리‘소고기’ 
 
관련검색어 
 
한우, 광우병, 미국산소고기, 소고기수입, 쇠고기, 소고기부위, 3000밑반찬종류, 고기, 소부위별그림, 소고기요리, 수입소고기, 소고기부위별사진, 갈비 
 
확장검색어 
 
소고기수입, 소고기수입반대서명, 소고기수입날짜, 소고기청문회, 소고기수입반대집회, 소고기미역국, 소고기협상 
 
쿼리‘방송사고’ 
 
관련검색어 
 
뉴스방송사고, 노출방송사고, 생방송사고, 방송노출사고, 여자노출사고, 역대방송사고, 방송사고동영상, 연예인가슴노출, 연예인방송사고, 연예인누드 
 
쿼리‘소녀시대’ 
 
확장검색어 
 
소녀시대baby baby, 소녀시대성형전, 소녀시대소녀시대, 소녀시대kissing you, 소녀시대다시만난세계 
 
쿼리‘메이크업’ 
 
관련검색어 
 
make-up, 화장, 메이크업배우기, 화장품, 화장예쁘게하는법, 눈화장하는방법, 눈커보이는화장법, 출장메이크업, 화장법, 화장법배우기, 아이라인그리는법, 스모키화장법, 메이크업아티스트 
 
화장검색어 
 
메이크업카, 메이크업포에버, 메이크업배우기, 메이크업팔레트, 메이크업박스, 메이크업베이스, 메이크업세트 
• 
관련검색어-유사동의어또는유사주제로쿼리확장가능 
• 
확장검색어-하위주제로쿼리확장가능 
[제안서] 주제검색과 오픈검색 - 민병국 18
편집된검색결과 
 
사용자가읽어내는방식으로검색결과출력 
 
필요한, 흥미있는모든주제를끄집어내어조합 
 
주제별, 상식별, 와인종류별등… 
 
이런방식은콜렉션내랭킹기준과전혀다름 
[제안서] 주제검색과 오픈검색 - 민병국 19
사람의편집에의한검색 
 
가장좋은검색결과는결국사람이하는검색 
 
신뢰성있는검색결과는보존될가치가있음 
 
키워드별로블로그를만들어보존하면어떨까? 
 
결과에대한사용자피드백수집통로로도이용 
[제안서] 주제검색과 오픈검색 - 민병국 20
검색필터 
 
기능별필터를사용자가add-on 하여검색 
 
사용자정의가능 
 
자신이좋아하는원더걸스의스케줄만보고싶다? (소녀시대도..) 
 
강남역의데이트장소만보고싶다? (대학로는, 홍대는, 잠실은??) 
[제안서] 주제검색과 오픈검색 - 민병국 21
주제검색&오픈검색가상시나리오 
 
Daum 주제검색페이지를열기전 
 
‘xx 방송사고’를찾고싶다 
 
그러나무슨방송사고로쳐야할지는모르겠다 
 
그문서를찾기위한가장좋은쿼리를모름(문서분포를모름) 
 
아뭏튼‘방송사고’를쿼리로해서주제검색 
 
Scene#1 –통합주제검색 
 
사람들이질의했던다양한‘방송사고’관련주제가나열됨 
 
찾았던‘뮤직뱅크방송사고’ 발견 
 
그문서그룹을찾기위한태그도제공, 관련문서건수도표시 
 
관련문서그룹만보기위해‘펼치기(더보기)’ 버튼을누름 
 
Scene#2 -주제상세검색 
 
‘뮤직뱅크방송사고’에대한정확도와주제유사도가높은순정렬 
 
문서마다문서내용을대표하는태크명시 
 
상단에문서그룹의태그가나열되어관련성이낮은태그들을휴지통에넣어비연관문서들을제거하며검색결과를수정할수있음 
 
가장좋은검색결과를공유하기위해오픈검색으로홀더링크를눌러보냄 
 
Scene#3 –Best오픈검색 
 
특정키워드에대한관련주제가디렉토리로연결되어있음 
 
‘뮤직뱅크방송사고’ 관련하여내가찜했던문서가상위문서로랭크되어있음 
 
내가찾았던문서보다더좋은문서도발견됨 
 
관련된다른주제들도흥미있음-> 블로그, 카페글, 뉴스, 동영상, 아고라, 세계N… 
 
관련주제에대해다른사람들의의견이트랙백으로연결되어있음 
 
누군가자기글이Best 오픈검색에올랐다고좋아하며댓글을달아놓았음 
[제안서] 주제검색과 오픈검색 - 민병국 22
<가상> 주제별통합검색-scene#1 
[제안서] 주제검색과 오픈검색 - 민병국 23
<가상> 주제별상세검색-scene#2 
즉시랭킹반영: AJAX 
[제안서] 주제검색과 오픈검색 - 민병국 24
<가상> 주제별오픈검색(블로그)-scene#3 
 
자동질의응답문서생성(cf. 지식in, 신지식) 
 
FAQ 처리 
 
모바일용검색결과 
 
채널통합및연결 
 
뉴스 
 
블로그 
 
카페 
 
신지식 
 
웹 
 
음악 
 
이미지 
 
동영상 
 
etc… 
 
카테고리관리 
 
자동생성 
 
기간별, 지역별등고정분류도가능 
 
사용자참여랭킹 
 
순위조정가능 
[제안서] 주제검색과 오픈검색 - 민병국 25
필요한기술 
 
쿼리클러스터링(Query Clustering) 
 
멀티쿼리를위한쿼리확장어수집 
 
유사질의및하위개념질의를위한질의주제자동분류 
 
문서분류를위한의미사전제공 
 
중복문서제거 
 
검색결과의품질향상(색인전, 검색후적용) 
 
중복문서제거에의한관련문서의리콜향상 
 
문서자동태깅 
 
사용자검색편집을위한도구제공 
 
주제상세검색을위한평가척도로활용 
 
주제유사도스코어링(Concept Similarity) 
 
주제검색시쿼리에대한정확도와주제유사도혼합하여랭킹 
 
특정주제의경우동영상, 사진우선등의별도의스코어링필요 
 
컬렉션간블렌딩(blending) 기법 
 
UCC 문서컬렉션, 뉴스, 동영상, 사진, 책, 음악, 지도등을혼합 
 
사용자주제적합성투표(voting)의수집및협업적(CF)랭킹기법 
 
해당문서에관련한모든주제에대해서도투표의점수를받을수있음 
[제안서] 주제검색과 오픈검색 - 민병국 26
기술적난제 
 
Scene#1 
 
기타주제에대한처리 
 
기존의일반검색으로커버(?) 
 
두가지이상주제의문서에대한처리 
 
주제섹션내중복과섹션별교차중복이있을수있음 
 
확장검색어의주제상충분한이격필요 
 
색인전중복제거와검색후중복제거필요 
 
Scene#2 
 
빈도높은짧은단어위주의태깅피하기 
 
문서에서추출한단어의경우경우의미성이정확한긴단어보다모호한짧은단어가태그로선정될수있음(Term Weighting) 
 
긴단어위주로태깅필요: 공백을접으면서기존단어와비교처리(?) 
 
쿼리와친밀도높은문서태그선정(이해도, 단어접근성) 
 
문서에서추출된태그는사용자가이해하기쉽지않을수있음 
 
쿼리에서추출된단어로문서의태그를선정해야함(필터링,변환) 
 
Scene#3 
 
오픈검색페이지의상업화방지와악의적투표의관리방안 
[제안서] 주제검색과 오픈검색 - 민병국 27
쿼리클러스터링 
 
쿼리전처리 
 
세션ID 부여, 키워드추출 
 
동일세션내빈도계산 
 
키워드간연관성계산및의미클러스터링 
 
각주제간충분한이격필요 
 
유사주제와관련주제, 하위주제의구분 
 
단어클러스터링, 구조적클러스터링 
 
유사어, 관련어, 하위어구분 
방송사고 
라디오 
방송사고 
KBS 
방송사고 
서민정 
방송사고 
동일세션 
[제안서] 주제검색과 오픈검색 - 민병국 28
하부그래프2~7간선무게합: 14.2520 
단어클러스터링 
 
연관도기준단어“허브” –ZMI 2.2 이상 
가정의료기기 
간병용품 
medi 
mall 
의료용품 
아로마 
목욕용품 
아로마테라피 
공유기 
네트워크 
랜카드 
라우터 
건강보조식품 
하부그래프1간선무게합: 68.3576 
하부그래프8간선무게합: 60.5544 
하부그래프11간선무게합: 7.8032 
하부그래프15간선무게합: 7.4993 
하부그래프2~7간선무게합: 14.2520 
하부그래프2~7간선무게합: 60.5544 
하부그래프2~7간선무게합: 14.2520 
하부그래프9,10간선무게합: 7.8032 
하부그래프14간선무게합: 7.4993 
하부그래프13간선무게합: 7.4997 
하부그래프12간선무게합: 7.4997 
[제안서] 주제검색과 오픈검색 - 민병 29 
국
문서자동태깅 
 
문서태깅 
 
문서의태그및연관도를색인항목으로포함 
 
쿼리로부터추출된단어와많이매칭되어야함 
 
사용자정의태그또는운영자정의태그도포함 
 
태그선정 
 
집단지능을이용: 사용자클릭문서에대해쿼리를태깅 
 
문서내중요단어를이용한태깅(정보량측정) 
 
문서전체, 구간별또는문단단위단어선정 
 
사전을이용한중요단어필터링 
[제안서] 주제검색과 오픈검색 - 민병국 30
통검쿼리기본통계 
 
전체데이터 
 
세션당약3회이상이므로세션을하나의트랜잭션(동시발생사건)으로처리가능함 
 
첫번째쿼리를이후쿼리가포함하는세션내쿼리데이터 
 
확장쿼리(재쿼리포함?)의사용비율을보기위한통계 
 
확장검색사용자비율(세션비율)은전체의약22% 
 
확장검색에사용된쿼리또한전체의약10% 
22%의세션에서같은주제를찾기위해평균2회이상쿼리했음을보여줌 
[제안서] 주제검색과 오픈검색 - 민병국 31 
세션수 
유일쿼리수 
쿼리회수 
세션당 
평균쿼리회수 
세션당 
최대쿼리회수 
5/8일자 
1,345,501 
1,606,571 
3,805,716 
2.8285 
20 
5/9일자 
1,333,035 
1,578,911 
3,783,449 
2.8382 
20 
5/10일자 
1,291,959 
1,484,076 
3,711,609 
2.8728 
20 
세션수 
세션 
전체비율 
유일쿼리수 
유일쿼리 
전체비율 
세션당 
평균쿼리회수 
세션당 
최대쿼리회수 
5/8일자 
295,403 
21.95% 
156,632 
9.75% 
1.2788 
17 
5/9일자 
294,027 
22.06% 
152,674 
9.67% 
1.2775 
19 
5/10일자 
289,149 
22.38% 
144,212 
9.72% 
1.2861 
19
통검쿼리–확장쿼리사례 
[제안서] 주제검색과 오픈검색 - 민병국 32 
순서 
쿼리 
1 
곡물 
2 
곡물가격 
3 
곡물 
4 
곡물콘플라이크 
5 
세계1위곡물수출국 
6 
세계3위곡물수출국 
7 
세계4위곡물수출국 
8 
세계5위곡물수출국 
9 
세계6위곡물수출국 
10 
세계7위곡물수출국 
11 
세계1위곡물수출국 
12 
세계2위곡물수출국 
13 
쌀주요수입국현황 
14 
곡물주요수입국현황 
15 
곡물주요수입국 
16 
최근곡물값이치솟은이유 
17 
네이버 
순서 
쿼리 
1 
피자 
2 
피자헛 
3 
피자 
4 
중곡동피자배달 
5 
군자동피자배달 
6 
피자119 
7 
군자동피자집 
8 
군자역근처피자집 
9 
군자역근처맛있는피자집 
10 
군자역근처피자집 
11 
군자역피자집 
12 
중곡동피자집 
13 
군자피자집 
14 
군자역피자집 
15 
피자주문 
16 
새벽2시피자배달 
17 
피자 
순서 
쿼리 
1 
소고기협상의교휸 
2 
소고기협상의교훈 
3 
3등급소고기 
4 
미국호주소고기수입 
5 
미국은호주소고기수입 
6 
소고기협상의문제 
7 
소고기협상내용 
8 
이정우 
9 
이정우교수 
?  
이정우교수소고기 
순서 
쿼리 
1 
광우병 
2 
광우병증상 
3 
광우병 
4 
광우병소 
5 
광우병
통검쿼리상위리뷰(1/2) 
 
2008.5.8일자1-150위(40634회~870회) 
 
Kang and Kim 2003 논문: 질의유형에맞추어검색효율을높이려는연구 
[제안서] 주제검색과 오픈검색 - 민병국 33 
구분 
개수 
쿼리 
사이트찾기(네비게이션) 
99 
네이버/ 사이월드/ 옥션/ 야후/ 국민은행/ 온에어/ g마켓/ 와와디스켓/ 우리은행/ 엣홈/ 더쇼룸/ 파일코리아/ 지마켓/ 신한은행/ 집코리아/ cgv / 인터파크/ 다음/ 네이트/ 구글/ 넷마블/ 이로모/ 네이트온/ 한게임/ 농협인터넷뱅킹/ kbs / 농협/ 세이클럽/ 서든어택/ mbc / 위디스크/ 판도라tv / 엠파스/ 아이템매니아/ 삼성카드/ 던파/ 팍스넷/ 보배드림/ 아이템베이/ 롯데닷컴/ 파란/ 파일노리/ 하나은행/ 대한항공/ 워크넷/ sbs / 신한카드/ 롯데시네마/ 멜론/ 현대카드/ 곰플레이어/ 피망/ 국민은행인터넷뱅킹/ 와우인벤/ 기업은행/ 스포츠조선/ 미래에셋증권/ 다나와/ ktf / 삼성전자/ 버디버디/ 알바몬/ 교보문고/ 외환은행/ 이랜드노동조합/ 이랜드일반노동조합/ 십이지천2 / gs홈쇼핑/ 와우메카/ 현대자동차/ 동양종금/ 메이플스토리/ 판도라/ 아고라/ 조선일보/ 사람인/ 스포츠서울/ 소리바다/ sk텔레콤/ 국세청/ 롯데카드/ 부동산114 / 리니지/ 롯데백화점/ 모키/ 싸이월드미니홈피/ 클럽박스/ t월드/ 홀인원비뇨기과/ 이마트/ 벅스뮤직/ 롯데홈쇼핑/ 신한은행인터넷뱅킹/ 엠파일/ 교차로/ 애니콜/ 벼룩시장 
정보찾기(뉴스,질의응답) 
26 
야마다유/ 문지은/ 이명박/ 조경태/ 이명박탄핵/ 지수원/ 광우병/ 오구리순/ 이계진/ 소녀시대/ 박용하/ 후(신인가수)/ 빅뱅/ 쇠고기청문회/ 박선주/ 김시향/ 다나카미호/ 화분(알렉스노래)/ 송윤아/ 어버이날/ 정운천/ 창업/ 진중권/ 이토히데아키/ 청문회/ 알렉스 
트랜잭션(서비스찾기) 
25 
이명박탄핵서명/ 아이언맨/ 환율/ 지하철노선도/ 스피드레이서/ 옥션정보유출확인방법/ 날씨/ 온에어18회/ 영화/ 100분토론/ 지도/ 웹하드/ 블리치169화/ 로또당첨번호/ stx팬오션/ 삼성중공업/ 아현동마님/ 아빠셋엄마하나/ 일지매/ 너는내운명/ 탄핵서명/ 블리치168화/ 곰플레이어최신버전다운로드/ 우편번호검색/ 로또/
통검쿼리상위리뷰(2/2) 
 
2008.5.8일자1001-1150위(194회~176회) 
 
1~150위와달리정보찾기의비율이높아짐(다른분류쿼리도정보성을띰) 
[제안서] 주제검색과 오픈검색 - 민병국 34 
구분 
개수 
쿼리 
사이트찾기(네비게이션) 
50 
이그잼/ 아틀란티카/ 여행박사/ www.naver.com / 뽀람/ 인천공항/ 한메일/ 레포트월드/ 한미르/ 성균관대학교/ 강남구청/ 경희대학교/ 따따따/ 하나은행인터넷뱅킹/ 스포츠토토/ 인터파크티켓예매/ 매일경제신문/ 폴더플러스/ 우체국인터넷뱅킹/ 카스온라인/ 프리챌/ imbc / 라그나로크/ 힌국방송통신대학교/ 노스페이스/ 경남은행/ 매일경제/ 피파/ 텐바이텐/ 게임엔젤/ 농수산홍쇼핑/ 커리어/ tvn / 서프라이즈/ 엄나구모성형외과/ 이랜드복지재단/ 복지넷/ 엽스샵/ 신문/ 바보몰/ 이랜드스토리/ 스킨푸드/ 크레딧뱅크/ 굿모닝신한증권/ 씨네월컴/ slr클럽/ 디그/ 바이크마트/ 영풍문고/ 뮤직온 
정보찾기(뉴스,질의응답) 
71 
고아라폰/ 브라운아이드걸스/ 이랜드프란시아/ 이랜드프란시아가구/ 미쓰라진막말/ 맨유/ 두산베어스/ 최수지/ 뮤/ 가슴확대/ 멘유경기일정/ 맛집/ 여행사/ 어머님은혜/ 한예슬/ 장동건/ 스타킹코니탤벗/ 싸이클론/ 아이팟/ 윤하/ 알렉스신애/ 박명수/ 중고차시세표/ 이계인/ 부산국제모터쇼/ 나비/ 신규폰게임/ 에임하이/ 보건복지부/ 박용하성형전후/ 장나라/ 로체/ 독도/ 서커스mc몽/ 채연/ 뽀로로/ 온에어ost / 이랜드그룹/ 편성표/ 루이비통/ 스승의날/ 김동욱/ 야마시타토모히사/ 전지현/ 자위/ 문국현/ 고전게임/ 모바일게임/ 기숙학원서울대반/ 이랜드상품권/ 자전거/ 기숙학원수능선행반/ 춘자네/ 닌텐도ds게임다운/ 이무송/ 기숙학원연고대반/ 인터넷소설/ 기숙학원재수선행반/ 고용보험/ 김구라/ 의료보험민영화/ 안소희/ 컨버스/ 로버트다우니주니어/ 조경태의원/ 청미/ 이력서/ 이랜드할인매장/ 이랜드월드/ 이랜드지식경영/ 클래지콰이 
트랜잭션(서비스찾기) 
29 
아내의반란/ 시계/ 원피스353화/ 온에어마지막회/ 음악/ 우산(윤하노래)/ 삼성테크윈/ 우편번호찾기/ 토토브라우저/ 쥬얼리모두다쉿다운/ 우리결혼했어요다시보기/ 스타크래프트립버전100%다운로드/ 알씨/ 가격비교/ 현대미포조선/ 남자쇼핑몰/ 이승기추억속의그대/ 곰플레이어다운로드/ 가십걸16화/ 춘자네경사났네/ 은혼105화/ 서든어택10킬소리/ 멜랑꼴리/ sg워너비라라라다운/ 데몬/ 색계/ 막돼먹은영애씨시즌3 / 코스피지수/ 색시몽/
포함쿼리vs포함세션 
 
장바구니범위정의 
 
특정키워드를포함한쿼리데이터만사용? 
 
세션당평균쿼리회수: 1.4회 
 
특정키워드를포함한세션내모든쿼리데이터사용? 
 
세션당평균쿼리회수: 2.75회 
 
약6배보다많은유일쿼리수: 연관단어의recall 증가 
[제안서] 주제검색과 오픈검색 - 민병국 35 
키워드“이명박” 
포함쿼리만사용 
포함세션내모든쿼리사용 
데이터일자 
세션수 
유일쿼리수 
쿼리회수 
유일쿼리수 
쿼리회수 
5/8(목) 
13,455 
1,877 
18,999 
12,574 
37,145 
5/9(금) 
11,358 
1,667 
15,658 
10,444 
30,762 
5/10(토) 
8,941 
1,481 
12,448 
9,383 
25,167 
5/11(일) 
6,879 
1,175 
9,574 
7,384 
19,065 
5/12(월) 
7,173 
1,394 
10,056 
7,956 
19,914 
5/13(화) 
6,508 
1,309 
9,282 
7,219 
17,788
“이명박”관련쿼리량변화(1~30위) 
[제안서] 주제검색과 오픈검색 - 민병국 36 
쿼리 
세션수 
쿼리회수 
탄핵서명 
6868 
7094 
탄핵 
2500 
2618 
미니홈피 
528 
535 
아고라 
486 
509 
탄핵서명조작 
356 
358 
아고라탄핵서명 
341 
348 
지지율 
311 
312 
노무현 
268 
282 
아고라탄핵 
239 
245 
광우병 
232 
239 
네이버 
226 
226 
독도 
181 
216 
독도포기 
186 
207 
탄핵을위한범국민운동본부 
193 
194 
안티카페 
167 
169 
되고송 
148 
163 
이 
153 
155 
탄핵서명사이트 
136 
143 
소고기 
133 
134 
청와대 
124 
124 
싸이월드 
117 
120 
안티 
112 
119 
조경태 
112 
116 
이계진 
112 
115 
촛불집회 
98 
101 
아고라서명운동 
97 
99 
탄핵서명아고라 
78 
97 
쇠고기청문회 
90 
95 
100분토론 
89 
90 
탄핵송 
85 
85 
■5/8 (목) 일자데이터 
■5/9 (금) 일자데이터 
■5/12 (월) 일자데이터 
쿼리 
세션수 
쿼리회수 
탄핵서명 
5835 
6051 
탄핵 
1983 
2075 
아고라 
586 
611 
아고라탄핵서명 
552 
566 
미니홈피 
437 
444 
지지율 
301 
313 
탄핵서명조작 
267 
267 
노무현 
214 
226 
광우병 
205 
217 
네이버 
185 
189 
100분토론 
185 
188 
되고송 
148 
173 
독도 
143 
156 
탄핵을위한범국민운동본부 
150 
151 
이 
148 
148 
탄핵서명사이트 
124 
129 
청와대 
124 
126 
아고라탄핵 
122 
124 
촛불집회 
122 
122 
안티 
108 
117 
독도포기 
104 
110 
탄핵서명아고라 
85 
98 
소고기 
92 
92 
이계진 
81 
81 
국회 
79 
79 
아고라서명운동 
78 
79 
탄핵송 
75 
79 
인터넷종량제 
72 
79 
오마이뉴스 
75 
77 
싸이월드 
73 
74 
쿼리 
세션수 
쿼리회수 
탄핵서명 
3420 
3523 
탄핵 
1186 
1242 
아고라탄핵서명 
347 
353 
아고라 
323 
342 
미니홈피 
309 
313 
지지율 
224 
231 
노무현 
173 
185 
탄핵서명조작 
154 
155 
광우병 
125 
131 
네이버 
100 
102 
안티 
96 
99 
되고송 
86 
97 
탄핵서명사이트 
80 
93 
국회 
83 
85 
독도 
75 
85 
탄핵을위한범국민운동본부 
77 
79 
청와대 
75 
77 
아고라탄핵 
69 
72 
이 
66 
66 
박근혜 
59 
65 
촛불문화제 
59 
61 
독도포기 
52 
56 
탄핵송 
51 
55 
일지매 
51 
53 
싸이월드 
47 
50 
pd수첩 
41 
43 
문국현탄핵 
39 
42 
탄핵서명아고라 
38 
42 
안티카페 
39 
41 
야후 
38 
40 
탄핵 
독도 
광우병 
지지율 
노무현 
탄핵서명 
소고기 
촛불집회
“노무현”관련쿼리량변화(1~30위) 
[제안서] 주제검색과 오픈검색 - 민병국 37 
쿼리 
세션수 
쿼리회수 
이명박 
193 
207 
청문회 
147 
158 
사람사는세상 
146 
147 
이명박탄핵서명 
129 
133 
예언 
91 
93 
홈페이지 
69 
70 
조경태 
60 
70 
봉하마을 
56 
61 
이명박탄핵 
54 
55 
김대중 
31 
32 
대통령 
27 
29 
미니홈피 
28 
28 
탄핵이유 
27 
27 
5공청문회 
25 
26 
청문회전두환 
23 
25 
탄핵 
22 
23 
이명박지지율 
21 
23 
지지율 
22 
22 
유시민 
22 
22 
노간지 
21 
22 
고개숙인 
21 
21 
연설 
21 
21 
전두환 
20 
20 
명패 
20 
20 
이라크방문 
14 
20 
청와대 
19 
19 
네이버 
18 
19 
다큐3일 
14 
18 
이명박미니홈피 
17 
17 
100분토론 
17 
17 
■5/8 (목) 일자데이터 
■5/9 (금) 일자데이터 
■5/12 (월) 일자데이터 
쿼리 
세션수 
쿼리회수 
이명박 
145 
160 
사람사는세상 
122 
123 
이명박탄핵서명 
108 
111 
예언 
103 
103 
홈페이지 
83 
86 
봉하마을 
46 
48 
청문회 
44 
44 
이명박탄핵 
34 
34 
조경태 
33 
34 
이명박미니홈피 
31 
32 
노간지 
23 
26 
이명박지지율 
25 
25 
김대중 
24 
25 
연설 
24 
25 
탄핵이유 
23 
23 
탄핵 
22 
23 
kbs 
21 
23 
전두환 
20 
22 
쇠고기 
20 
20 
미니홈피 
20 
20 
광우병 
20 
20 
유시민 
19 
20 
청와대 
19 
20 
청문회전두환 
19 
19 
박근혜 
18 
18 
독도연설 
16 
18 
shangus 
17 
17 
봉화마을 
14 
17 
조중동 
13 
17 
이계진 
15 
16 
쿼리 
세션수 
쿼리회수 
사람사는세상 
120 
124 
이명박 
113 
120 
이명박탄핵서명 
103 
106 
예언 
53 
57 
홈페이지 
52 
55 
봉하마을 
50 
53 
김대중 
28 
29 
유시민 
27 
29 
동영상 
25 
26 
전두환 
22 
25 
이명박탄핵 
23 
23 
이명박미니홈피 
21 
21 
탄핵 
19 
19 
이해찬 
17 
18 
대통령 
16 
18 
네이버 
17 
17 
박근혜 
16 
17 
청문회 
16 
17 
청와대 
16 
17 
오마이뉴스 
16 
16 
연설 
16 
16 
미니홈피 
15 
15 
shangus 
15 
15 
노간지 
14 
15 
이명박지지율 
14 
14 
노태우 
13 
14 
kbs 
11 
14 
김영삼 
13 
13 
독도연설 
12 
13 
광우병 
12 
13 
이명박 
사람사는세상 
봉하마을 
예언 
홈페이지 
전두환 
청문회 
노간지 
대통령 
독도연설
쿼리의연관단어리콜향상 
 
쿼리에사용된단어 
 
여러하부주제를포함하는가장작은길이의단어 
 
전문성또는가장하부주제를나타내는특정단어 
 
단어의구분 
 
광의의기본단어 
 
협의의확장단어 
 
단어의출처 
 
광의의기본단어는여러문서에분포되어있음 
 
협의의확장단어는입소문또는어떤문서의출처를갖음 
 
쿼리의연관단어추출 
 
의미연결이끊겨있는쿼리로만으로는연관단어연결부적절 
 
협의의확장단어의출처문서로부터쿼리의연관단어를연결수집 
 
빈도가낮아연결되지못하는단어를문서로부터수집 
 
쿼리와문서를자동으로연결해나가는과정을반복하며구성됨 
 
쿼리의문서모델과문서의쿼리모델을병합하는효과 
[제안서] 주제검색과 오픈검색 - 민병국 38

Mais conteúdo relacionado

Destaque

프로젝트B 설정의 방향 외부용
프로젝트B 설정의 방향   외부용프로젝트B 설정의 방향   외부용
프로젝트B 설정의 방향 외부용Ju Young Lee
 
쏠투스회사소개서20090824
쏠투스회사소개서20090824쏠투스회사소개서20090824
쏠투스회사소개서20090824Freelancer
 
[메조미디어] Campaign creative_2014.03
[메조미디어] Campaign creative_2014.03[메조미디어] Campaign creative_2014.03
[메조미디어] Campaign creative_2014.03MezzoMedia
 
SNS전문가 천재영 트렌더즈 성공전략 롯데호텔 특강
SNS전문가 천재영 트렌더즈 성공전략 롯데호텔 특강SNS전문가 천재영 트렌더즈 성공전략 롯데호텔 특강
SNS전문가 천재영 트렌더즈 성공전략 롯데호텔 특강재영 천
 
[2011 1-2]lotte
[2011 1-2]lotte[2011 1-2]lotte
[2011 1-2]lottenceo
 
유노커뮤니케이션즈 바이럴마케팅 표준제안서
유노커뮤니케이션즈 바이럴마케팅 표준제안서유노커뮤니케이션즈 바이럴마케팅 표준제안서
유노커뮤니케이션즈 바이럴마케팅 표준제안서유노 커뮤니케이션즈
 
스마트 리뷰 마케팅 제안서
스마트 리뷰 마케팅 제안서스마트 리뷰 마케팅 제안서
스마트 리뷰 마케팅 제안서withblog
 
기획안 만들기
기획안 만들기기획안 만들기
기획안 만들기BongSoo Jang
 
Syrup_표준 영업 제안서_LE 대상v_배포
Syrup_표준 영업 제안서_LE 대상v_배포Syrup_표준 영업 제안서_LE 대상v_배포
Syrup_표준 영업 제안서_LE 대상v_배포승한 진
 
[메조미디어] 2017년 미디어트렌드리포트
[메조미디어] 2017년 미디어트렌드리포트[메조미디어] 2017년 미디어트렌드리포트
[메조미디어] 2017년 미디어트렌드리포트MezzoMedia
 

Destaque (13)

프로젝트B 설정의 방향 외부용
프로젝트B 설정의 방향   외부용프로젝트B 설정의 방향   외부용
프로젝트B 설정의 방향 외부용
 
쏠투스회사소개서20090824
쏠투스회사소개서20090824쏠투스회사소개서20090824
쏠투스회사소개서20090824
 
[메조미디어] Campaign creative_2014.03
[메조미디어] Campaign creative_2014.03[메조미디어] Campaign creative_2014.03
[메조미디어] Campaign creative_2014.03
 
SNS전문가 천재영 트렌더즈 성공전략 롯데호텔 특강
SNS전문가 천재영 트렌더즈 성공전략 롯데호텔 특강SNS전문가 천재영 트렌더즈 성공전략 롯데호텔 특강
SNS전문가 천재영 트렌더즈 성공전략 롯데호텔 특강
 
LOTTE GLOBAL YOUTH
LOTTE GLOBAL YOUTH LOTTE GLOBAL YOUTH
LOTTE GLOBAL YOUTH
 
[2011 1-2]lotte
[2011 1-2]lotte[2011 1-2]lotte
[2011 1-2]lotte
 
유노커뮤니케이션즈 바이럴마케팅 표준제안서
유노커뮤니케이션즈 바이럴마케팅 표준제안서유노커뮤니케이션즈 바이럴마케팅 표준제안서
유노커뮤니케이션즈 바이럴마케팅 표준제안서
 
스마트 리뷰 마케팅 제안서
스마트 리뷰 마케팅 제안서스마트 리뷰 마케팅 제안서
스마트 리뷰 마케팅 제안서
 
[법인영업 GA] 제안서 작성
[법인영업 GA] 제안서 작성[법인영업 GA] 제안서 작성
[법인영업 GA] 제안서 작성
 
기획안 만들기
기획안 만들기기획안 만들기
기획안 만들기
 
Syrup_표준 영업 제안서_LE 대상v_배포
Syrup_표준 영업 제안서_LE 대상v_배포Syrup_표준 영업 제안서_LE 대상v_배포
Syrup_표준 영업 제안서_LE 대상v_배포
 
sungmin slide
sungmin slidesungmin slide
sungmin slide
 
[메조미디어] 2017년 미디어트렌드리포트
[메조미디어] 2017년 미디어트렌드리포트[메조미디어] 2017년 미디어트렌드리포트
[메조미디어] 2017년 미디어트렌드리포트
 

Semelhante a [2008] 민병국 - 주제검색과 오픈검색 (제안)

제1장 정보검색소개
제1장 정보검색소개제1장 정보검색소개
제1장 정보검색소개Chang-yong Jung
 
News Big Data Analytics
News Big Data AnalyticsNews Big Data Analytics
News Big Data AnalyticsDaemin Park
 
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"Tae Young Kang
 
150514 경북대학교(콘텐츠산업과 창업)
150514 경북대학교(콘텐츠산업과 창업)150514 경북대학교(콘텐츠산업과 창업)
150514 경북대학교(콘텐츠산업과 창업)Hee Dae Kim
 
[NDC2014]쉽게 따라 할 수있는 "꽤" 훌륭한 유저 동향 분석 시스템
[NDC2014]쉽게 따라 할 수있는 "꽤" 훌륭한 유저 동향 분석 시스템[NDC2014]쉽게 따라 할 수있는 "꽤" 훌륭한 유저 동향 분석 시스템
[NDC2014]쉽게 따라 할 수있는 "꽤" 훌륭한 유저 동향 분석 시스템Hoyeon Kim
 
Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보Jiun Bae
 
JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

JIGSAW: Interactive Mobile Visual Search with Multimodal Queries
JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

JIGSAW: Interactive Mobile Visual Search with Multimodal Queries
Sumi Kim
 
랭크웨이브 소셜 마케팅 솔루션 20140409
랭크웨이브 소셜 마케팅 솔루션 20140409랭크웨이브 소셜 마케팅 솔루션 20140409
랭크웨이브 소셜 마케팅 솔루션 20140409Sungwha Shim
 
인터넷리터러시교육강사 140729 강장묵
인터넷리터러시교육강사 140729 강장묵인터넷리터러시교육강사 140729 강장묵
인터넷리터러시교육강사 140729 강장묵JM code group
 
디지털시대 고객분석과 대응(세종대 이동일교수)
디지털시대 고객분석과 대응(세종대 이동일교수)디지털시대 고객분석과 대응(세종대 이동일교수)
디지털시대 고객분석과 대응(세종대 이동일교수)Digital Initiative Group
 
Process for Big Data Analysis
Process for Big Data AnalysisProcess for Big Data Analysis
Process for Big Data AnalysisMyunggoon Choi
 
[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래
[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래
[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래Taehoon Ko
 
BS501 발표자료
BS501 발표자료BS501 발표자료
BS501 발표자료Park Sungpil
 
디포커스 전홍구
디포커스 전홍구디포커스 전홍구
디포커스 전홍구Newsjelly
 
사이버컴과 네트워크분석 13주차 1
사이버컴과 네트워크분석 13주차 1사이버컴과 네트워크분석 13주차 1
사이버컴과 네트워크분석 13주차 1Han Woo PARK
 
How to do things with 'BigKinds'
How to do things with 'BigKinds'How to do things with 'BigKinds'
How to do things with 'BigKinds'Daemin Park
 
이벤트: 마이크로서비스 도입, 이렇게 한다
이벤트: 마이크로서비스 도입, 이렇게 한다이벤트: 마이크로서비스 도입, 이렇게 한다
이벤트: 마이크로서비스 도입, 이렇게 한다Jay Park
 

Semelhante a [2008] 민병국 - 주제검색과 오픈검색 (제안) (20)

제1장 정보검색소개
제1장 정보검색소개제1장 정보검색소개
제1장 정보검색소개
 
News Big Data Analytics
News Big Data AnalyticsNews Big Data Analytics
News Big Data Analytics
 
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"
2022.07.01 불평등연구회 특강 "계량모형과 자연어 분석을 결합하기"
 
150514 경북대학교(콘텐츠산업과 창업)
150514 경북대학교(콘텐츠산업과 창업)150514 경북대학교(콘텐츠산업과 창업)
150514 경북대학교(콘텐츠산업과 창업)
 
[NDC2014]쉽게 따라 할 수있는 "꽤" 훌륭한 유저 동향 분석 시스템
[NDC2014]쉽게 따라 할 수있는 "꽤" 훌륭한 유저 동향 분석 시스템[NDC2014]쉽게 따라 할 수있는 "꽤" 훌륭한 유저 동향 분석 시스템
[NDC2014]쉽게 따라 할 수있는 "꽤" 훌륭한 유저 동향 분석 시스템
 
Memento
MementoMemento
Memento
 
Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보
 
JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

JIGSAW: Interactive Mobile Visual Search with Multimodal Queries
JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

JIGSAW: Interactive Mobile Visual Search with Multimodal Queries

 
랭크웨이브 소셜 마케팅 솔루션 20140409
랭크웨이브 소셜 마케팅 솔루션 20140409랭크웨이브 소셜 마케팅 솔루션 20140409
랭크웨이브 소셜 마케팅 솔루션 20140409
 
인터넷리터러시교육강사 140729 강장묵
인터넷리터러시교육강사 140729 강장묵인터넷리터러시교육강사 140729 강장묵
인터넷리터러시교육강사 140729 강장묵
 
디지털시대 고객분석과 대응(세종대 이동일교수)
디지털시대 고객분석과 대응(세종대 이동일교수)디지털시대 고객분석과 대응(세종대 이동일교수)
디지털시대 고객분석과 대응(세종대 이동일교수)
 
Process for Big Data Analysis
Process for Big Data AnalysisProcess for Big Data Analysis
Process for Big Data Analysis
 
[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래
[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래
[오컴 Clip IT 세미나] 머신러닝과 인공지능의 현재와 미래
 
BS501 발표자료
BS501 발표자료BS501 발표자료
BS501 발표자료
 
디포커스 전홍구
디포커스 전홍구디포커스 전홍구
디포커스 전홍구
 
사이버컴과 네트워크분석 13주차 1
사이버컴과 네트워크분석 13주차 1사이버컴과 네트워크분석 13주차 1
사이버컴과 네트워크분석 13주차 1
 
How to do things with 'BigKinds'
How to do things with 'BigKinds'How to do things with 'BigKinds'
How to do things with 'BigKinds'
 
이벤트: 마이크로서비스 도입, 이렇게 한다
이벤트: 마이크로서비스 도입, 이렇게 한다이벤트: 마이크로서비스 도입, 이렇게 한다
이벤트: 마이크로서비스 도입, 이렇게 한다
 
Study mate
Study mateStudy mate
Study mate
 
[4차]구글 알고리즘 분석(151106)
[4차]구글 알고리즘 분석(151106)[4차]구글 알고리즘 분석(151106)
[4차]구글 알고리즘 분석(151106)
 

Mais de 병국 민

Survey - 카페 추천 기술기획 (2014-02-10)
Survey - 카페 추천 기술기획 (2014-02-10)Survey - 카페 추천 기술기획 (2014-02-10)
Survey - 카페 추천 기술기획 (2014-02-10)병국 민
 
쿼리로그로부터 주제별 키워드 수집 방안 민병국-20131213
쿼리로그로부터 주제별 키워드 수집 방안 민병국-20131213쿼리로그로부터 주제별 키워드 수집 방안 민병국-20131213
쿼리로그로부터 주제별 키워드 수집 방안 민병국-20131213병국 민
 
네비게이션 검색 통합 - 민병국(2009)
네비게이션 검색 통합 - 민병국(2009)네비게이션 검색 통합 - 민병국(2009)
네비게이션 검색 통합 - 민병국(2009)병국 민
 
민병국 - 검색품질관리툴 (스팸어수집, 비정상문서검출)
민병국 - 검색품질관리툴 (스팸어수집, 비정상문서검출)민병국 - 검색품질관리툴 (스팸어수집, 비정상문서검출)
민병국 - 검색품질관리툴 (스팸어수집, 비정상문서검출)병국 민
 
[2008] 숭실대컴퓨터학부 외부세미나 민병국 - Daum검색 튜토리얼
[2008] 숭실대컴퓨터학부 외부세미나 민병국 - Daum검색 튜토리얼[2008] 숭실대컴퓨터학부 외부세미나 민병국 - Daum검색 튜토리얼
[2008] 숭실대컴퓨터학부 외부세미나 민병국 - Daum검색 튜토리얼병국 민
 
[2007] 논문발표 민병국-단어연관그래프를 이용한 단어 의미의 자동...
[2007] 논문발표 민병국-단어연관그래프를 이용한 단어 의미의 자동...[2007] 논문발표 민병국-단어연관그래프를 이용한 단어 의미의 자동...
[2007] 논문발표 민병국-단어연관그래프를 이용한 단어 의미의 자동...병국 민
 

Mais de 병국 민 (6)

Survey - 카페 추천 기술기획 (2014-02-10)
Survey - 카페 추천 기술기획 (2014-02-10)Survey - 카페 추천 기술기획 (2014-02-10)
Survey - 카페 추천 기술기획 (2014-02-10)
 
쿼리로그로부터 주제별 키워드 수집 방안 민병국-20131213
쿼리로그로부터 주제별 키워드 수집 방안 민병국-20131213쿼리로그로부터 주제별 키워드 수집 방안 민병국-20131213
쿼리로그로부터 주제별 키워드 수집 방안 민병국-20131213
 
네비게이션 검색 통합 - 민병국(2009)
네비게이션 검색 통합 - 민병국(2009)네비게이션 검색 통합 - 민병국(2009)
네비게이션 검색 통합 - 민병국(2009)
 
민병국 - 검색품질관리툴 (스팸어수집, 비정상문서검출)
민병국 - 검색품질관리툴 (스팸어수집, 비정상문서검출)민병국 - 검색품질관리툴 (스팸어수집, 비정상문서검출)
민병국 - 검색품질관리툴 (스팸어수집, 비정상문서검출)
 
[2008] 숭실대컴퓨터학부 외부세미나 민병국 - Daum검색 튜토리얼
[2008] 숭실대컴퓨터학부 외부세미나 민병국 - Daum검색 튜토리얼[2008] 숭실대컴퓨터학부 외부세미나 민병국 - Daum검색 튜토리얼
[2008] 숭실대컴퓨터학부 외부세미나 민병국 - Daum검색 튜토리얼
 
[2007] 논문발표 민병국-단어연관그래프를 이용한 단어 의미의 자동...
[2007] 논문발표 민병국-단어연관그래프를 이용한 단어 의미의 자동...[2007] 논문발표 민병국-단어연관그래프를 이용한 단어 의미의 자동...
[2007] 논문발표 민병국-단어연관그래프를 이용한 단어 의미의 자동...
 

[2008] 민병국 - 주제검색과 오픈검색 (제안)

  • 1. 제안배경-웹2.0 & 집단지능& SNS etc… 제안서(초안) 작성자: 민병국(2008.4.30)
  • 2. 검색: 쿼리가가리키는문서위치제어 사용자쿼리 문서셋(콜렉션) 쿼리와문서를1:1로직접연결 쿼리를여과없이반영: 수동적인검색 1 2 3 역색인파일을여과없이적용: 단순필터링과스코어링 [제안서] 주제검색과 오픈검색 - 민병국 2
  • 3. 현재의검색기술  90년대부터디스크가격이낮아지면서현실화  빠른속도의String Search를위해Text에서검색대상이되는String(단어)를추출하고위치를기록  Text 원문대비80% ~ 400% 수준의역색인구축  Ranking 모델  다양한통계적모델이제시됨  Online update 처리  실시간문서추가, 삭제, 변경 키워드기반검색엔진으로부터탈피 • Question Answering • Classification • Summarization • Recommender Systems • Cross Language IR • Information Extraction • Topic Detection & Tracking • 정보공유의필요성 • 분류된정보의필요성 • 양질의정보의정렬의필요성 • 더정확한결과의필요성 변화 의미검색으로의확장 [제안서] 주제검색과 오픈검색 - 민병국 3
  • 4. 능동적인검색: 모델링, 전처리 사용자쿼리 문서 문서모델링: 연관검색어, 쿼리확장등.. 쿼리모델링: Clustering, MI, Categorization 등.. + 의미사전 의미색인(Semantic Indexing) or언어모델링(Language Modeling) [제안서] 주제검색과 오픈검색 - 민병국 4
  • 5. SNS (Social Network Service)  정의  사회적관계개념을인터넷공간으로가져와사람과사람간의관계맺기를통해네트워크형성을지원하며개인의일상사나관심사를공유/소통시켜주는서비스  같은취미나생각을가진사람들끼리네트워크가형성되면단기간내에폭발적으로확대될수있어포털사이트들의새로운수익모델로자리잡아가고있음  종류  블로그형: FriendStar(2002), MySpace(2003)  오픈형: Facebook(2004)  폐쇄형: Mixi(미쿠시,일본), YUCASEE(일본)  니치형: Dogster, Catster, Boompa, Farmster, TotJot, Traineo, Daum Cafe  매칭형: Linkedln(미국), Ecademy(영국)  영상중심형: YouTube(2005,캐나다)  검색중심형: Eurekster [제안서] 주제검색과 오픈검색 - 민병국 5
  • 6. Social Network와FOAF  소셜네트워크에서온톨로지필요성  온톨로지기술을활용하여웹인프라로써구축가능  사람들은FOAF와같은온톨로지를통해다양한사람들과손쉽게연결될수있음  친구의친구(FOAF: Friend Of A Friend)  친구를통해친구를만들어가는인간관계를RDF로표현한온톨로지  ‘A가B를알고있다’-> ‘foaf:knows’라는속성으로표현  FOAF에표현된개인정보와간단한Social Network 정보는FOAF를지원하는시스템을통하여다른FOAF 문서에연결될수있음  FOAF가자신의홈페이지에RSS와같은방식으로공개되면다른사용자가이를참조할수있는데, 이를통해연결성이확장될수있음  직장, 학교, People You Know 항목등.. foaf:knows foaf:knows foaf:knows foaf:knows foaf:knows foaf:knows foaf:knows foaf:knows [제안서] 주제검색과 오픈검색 - 민병국 6
  • 7. 집단지성(Collective Intelligence)  정의  다수의개체들이서로협력혹은경쟁을통하여얻게되는지적능력에의한결과로얻어진집단적능력  집단지능, 협업지성, 공생적지능이라고도함  활용예  위키백과(Wikipedia)  크라우드소싱  롱테일경제원리를바탕으로한다양한지식비지니스에서효율성향상을위해크라우드소싱을통해집단지성을활용하고있음  지능형음악서비스  사이버음악동호회, 음악포털, 블로그홈페이지등으로부터사용자상황따라맞춤형음악추천 집단지성또는사회망에의한모델링 쿼리 문서 (기분,날씨,이벤트등..) [제안서] 주제검색과 오픈검색 - 민병국 7
  • 8. 웹2.0  웹2.0의특징(by 팀오라일리)  플랫폼으로서의웹(The Web as Platform)  집단지성(collective intelligence) 이용  데이터는다음세대의인텔인사이드  소프트웨어릴리즈주기의종말  가벼운(Lightweight) 프로그래밍모델  단일디바이스를넘어선소프트웨어  풍부한사용자경험  웹2.0 서비스모델의특징  매쉬업(Mashup)  대중(사용자)에의한분류방법:포크소노미(Folksonomy)  롱테일(Long Tail)  소셜네트워크서비스(SNS: social network service)  CMS(Content Management System)  퍼머링크(Permalink) = 고정링크  마이크로포맷(microfomats) [제안서] 주제검색과 오픈검색 - 민병국 8
  • 9. 미래웹의형태들  쉬운웹(EasyWeb)  오프라인과괴리감이없는온라인서비스  현재의웹2.0 방향  밝은웹(BrightWeb)  웹에오가는사람과그사람의행동이보이는웹  검색과이동의개념변화, 분산형포털, n2n웹  리얼웹(RealWeb)  현재의검색사이트: 과거의문서를검색, 웹자체도정적웹  실시간이강화되고개인자체가저장장치가되고아바타가되는웹  아트만웹(AtmanWeb), 로밍웹(RoamingWeb)  개인정보를가지고다니는로밍데이터시대, 커뮤니티가사람을따라움직이는로밍커뮤니티시대  개인자체가웹의시작이자끝이되는웹, 개인이웹의한구성원이자전부인시대  생물학적웹(BioWeb)  스스로생성, 성장, 소멸하는웹, 웹안의웹 [제안서] 주제검색과 오픈검색 - 민병국 9
  • 10. 분산네트워크 게이트웨이  메트카프의법칙(Metcalfe’s Law)  네트워크의가치가사용자의수의제곱에비례(네트워크효과)  웹에서의네트워크  게이트웨이(Gateway): 구글, 야후, 네이버  노드(Node): 이용자의최종목적지, 콘텐츠의공급자  허브(Hub): 센터로서독자적인네트워크를형성할수있는플랫폼  네트워크의생태계순환  CP는무한히증식(open 개념에의한확장)  Top-down 흐름에서상위는best 문서만다루면됨(신뢰성) 허브 허브 허브 노드 노드 노드 노드 노드 노드 노드 노드 노드 노드 노드 노드 [제안서] 주제검색과 오픈검색 - 민병국 10
  • 12. 검색과정: 질의주제질의어결과문서선별클릭평가재검색 질의어‘방송사고’ 질의주제‘xx 방송사고’ : 무슨일인데? 누가? 뭘? => 눈으로찾으라고? (0.5초) 안띄네.. => 비슷한것있군. 뭐지? 바로클릭! ‘방송사고’ 관련문서모두검색-최근방송사고, 큰방송사고-날뻔한방송사고, 사고이후-방송국헤이?, 네티즌비난-중국,외국/ 동영상,다시보기-사고관련방송, 방송언어와사고방식-방송관련해아쉬움사고있음-사고관련법률등방송교재-주제별중복다수… 쿼리선택=> 모름, 대충작성… [제안서] 주제검색과 오픈검색 - 민병국 12
  • 13. 질의주제와문서주제의매칭 vs 동상이몽??  시멘틱검색: 어떻게??  동의어, 유사어시소러스: 쿼리확장어(리콜확대,유사질의모으기)  쿼리내연관단어: 방송사고->노출방송사고->야한영화, 일본야동(네티즌선택,재검색유발)  문서의미클러스터링: 사용자질의주제와맞는가? How detail or How rough? 질의의분포 문서의분포 [제안서] 주제검색과 오픈검색 - 민병국 13
  • 14. 통합검색스타일vs 시멘틱검색스타일 … 쿼리 뉴스 블로그 카페 웹 통합검색 시멘틱검색(?) 뉴스 블로그 카페 웹 … 경제 사회 문화 정치 … 뉴스 블로그 카페 웹 웹 뉴스 웹 뉴스 뉴스 웹 블로그 경제 사회 건강 문화 정치 생활 건강 경제 생활 국제 경제 문화 다음 네이버 큐로보 구글 [제안서] 주제검색과 오픈검색 - 민병국 14
  • 15. 제안의목적  사용자가선택한주제로검색을집중하자!! => 검색엔진이몽땅퍼다주는내용을보고선별하는것보다자신이선택한내용내에서선별하는즐거움을주자  주제별리콜을높이자!!  남들도많이찾는주제를빠짐없이보여주자(사회망,집단지능)  관련주제도함께보여주어검색결과를이해시키고재쿼리를유도하자(수평적확장검색)  주제별정확도를높이자!! (사용자편집검색, Back 기능필수)  주제에대한집중도를높여만족도를높이자(결과내재검색, 휴지통) ⇒ 클러스터링보다훨씬효과적이고호응도가높을거라생각함  사용자참여에의한검색결과를만들자!! => 사용자편집검색을집단적으로축적하여사용할수있도록하자  정말잘들어맞은검색결과를남들도이용하게하자!!  주제별(키워드별) 검색결과블로그를만들어퍼나르기(축적, 평가)  쿼리없이무작정눌러보기일경우태그를입력토록유도  사용자들이검색결과를만들어보도록하자!!(Wiki 스타일)  주제별(키워드별) 검색결과블로그의내용추가/정렬할환경제공 [제안서] 주제검색과 오픈검색 - 민병국 15
  • 16. 다양한주제의군집검색결과 [제안서] 주제검색과 오픈검색 - 민병국 16  다양한주제제시  Logtail을제외한찾고자하는주제는거의다나옴  찾고자하는주제에대한네비게이션기능수행  검색결과를잡지보듯이읽게함 사용자recall 향상  같은주제의결과군집  관심주제에대해서만나올거라는, 관련성있는문서만나올거라는신뢰감형성  주제내검색에대한Zoom In/Out 기능 Scatter & Gather 기능
  • 17. 검색결과의클러스터링  같은내용별로묶어서, 중복은딸린링크로출력  문서의임의적클러스터링결과는사람이이해하기어려움 [제안서] 주제검색과 오픈검색 - 민병국 17
  • 18. Daum의관련/확장검색어  쿼리‘소고기’  관련검색어  한우, 광우병, 미국산소고기, 소고기수입, 쇠고기, 소고기부위, 3000밑반찬종류, 고기, 소부위별그림, 소고기요리, 수입소고기, 소고기부위별사진, 갈비  확장검색어  소고기수입, 소고기수입반대서명, 소고기수입날짜, 소고기청문회, 소고기수입반대집회, 소고기미역국, 소고기협상  쿼리‘방송사고’  관련검색어  뉴스방송사고, 노출방송사고, 생방송사고, 방송노출사고, 여자노출사고, 역대방송사고, 방송사고동영상, 연예인가슴노출, 연예인방송사고, 연예인누드  쿼리‘소녀시대’  확장검색어  소녀시대baby baby, 소녀시대성형전, 소녀시대소녀시대, 소녀시대kissing you, 소녀시대다시만난세계  쿼리‘메이크업’  관련검색어  make-up, 화장, 메이크업배우기, 화장품, 화장예쁘게하는법, 눈화장하는방법, 눈커보이는화장법, 출장메이크업, 화장법, 화장법배우기, 아이라인그리는법, 스모키화장법, 메이크업아티스트  화장검색어  메이크업카, 메이크업포에버, 메이크업배우기, 메이크업팔레트, 메이크업박스, 메이크업베이스, 메이크업세트 • 관련검색어-유사동의어또는유사주제로쿼리확장가능 • 확장검색어-하위주제로쿼리확장가능 [제안서] 주제검색과 오픈검색 - 민병국 18
  • 19. 편집된검색결과  사용자가읽어내는방식으로검색결과출력  필요한, 흥미있는모든주제를끄집어내어조합  주제별, 상식별, 와인종류별등…  이런방식은콜렉션내랭킹기준과전혀다름 [제안서] 주제검색과 오픈검색 - 민병국 19
  • 20. 사람의편집에의한검색  가장좋은검색결과는결국사람이하는검색  신뢰성있는검색결과는보존될가치가있음  키워드별로블로그를만들어보존하면어떨까?  결과에대한사용자피드백수집통로로도이용 [제안서] 주제검색과 오픈검색 - 민병국 20
  • 21. 검색필터  기능별필터를사용자가add-on 하여검색  사용자정의가능  자신이좋아하는원더걸스의스케줄만보고싶다? (소녀시대도..)  강남역의데이트장소만보고싶다? (대학로는, 홍대는, 잠실은??) [제안서] 주제검색과 오픈검색 - 민병국 21
  • 22. 주제검색&오픈검색가상시나리오  Daum 주제검색페이지를열기전  ‘xx 방송사고’를찾고싶다  그러나무슨방송사고로쳐야할지는모르겠다  그문서를찾기위한가장좋은쿼리를모름(문서분포를모름)  아뭏튼‘방송사고’를쿼리로해서주제검색  Scene#1 –통합주제검색  사람들이질의했던다양한‘방송사고’관련주제가나열됨  찾았던‘뮤직뱅크방송사고’ 발견  그문서그룹을찾기위한태그도제공, 관련문서건수도표시  관련문서그룹만보기위해‘펼치기(더보기)’ 버튼을누름  Scene#2 -주제상세검색  ‘뮤직뱅크방송사고’에대한정확도와주제유사도가높은순정렬  문서마다문서내용을대표하는태크명시  상단에문서그룹의태그가나열되어관련성이낮은태그들을휴지통에넣어비연관문서들을제거하며검색결과를수정할수있음  가장좋은검색결과를공유하기위해오픈검색으로홀더링크를눌러보냄  Scene#3 –Best오픈검색  특정키워드에대한관련주제가디렉토리로연결되어있음  ‘뮤직뱅크방송사고’ 관련하여내가찜했던문서가상위문서로랭크되어있음  내가찾았던문서보다더좋은문서도발견됨  관련된다른주제들도흥미있음-> 블로그, 카페글, 뉴스, 동영상, 아고라, 세계N…  관련주제에대해다른사람들의의견이트랙백으로연결되어있음  누군가자기글이Best 오픈검색에올랐다고좋아하며댓글을달아놓았음 [제안서] 주제검색과 오픈검색 - 민병국 22
  • 23. <가상> 주제별통합검색-scene#1 [제안서] 주제검색과 오픈검색 - 민병국 23
  • 24. <가상> 주제별상세검색-scene#2 즉시랭킹반영: AJAX [제안서] 주제검색과 오픈검색 - 민병국 24
  • 25. <가상> 주제별오픈검색(블로그)-scene#3  자동질의응답문서생성(cf. 지식in, 신지식)  FAQ 처리  모바일용검색결과  채널통합및연결  뉴스  블로그  카페  신지식  웹  음악  이미지  동영상  etc…  카테고리관리  자동생성  기간별, 지역별등고정분류도가능  사용자참여랭킹  순위조정가능 [제안서] 주제검색과 오픈검색 - 민병국 25
  • 26. 필요한기술  쿼리클러스터링(Query Clustering)  멀티쿼리를위한쿼리확장어수집  유사질의및하위개념질의를위한질의주제자동분류  문서분류를위한의미사전제공  중복문서제거  검색결과의품질향상(색인전, 검색후적용)  중복문서제거에의한관련문서의리콜향상  문서자동태깅  사용자검색편집을위한도구제공  주제상세검색을위한평가척도로활용  주제유사도스코어링(Concept Similarity)  주제검색시쿼리에대한정확도와주제유사도혼합하여랭킹  특정주제의경우동영상, 사진우선등의별도의스코어링필요  컬렉션간블렌딩(blending) 기법  UCC 문서컬렉션, 뉴스, 동영상, 사진, 책, 음악, 지도등을혼합  사용자주제적합성투표(voting)의수집및협업적(CF)랭킹기법  해당문서에관련한모든주제에대해서도투표의점수를받을수있음 [제안서] 주제검색과 오픈검색 - 민병국 26
  • 27. 기술적난제  Scene#1  기타주제에대한처리  기존의일반검색으로커버(?)  두가지이상주제의문서에대한처리  주제섹션내중복과섹션별교차중복이있을수있음  확장검색어의주제상충분한이격필요  색인전중복제거와검색후중복제거필요  Scene#2  빈도높은짧은단어위주의태깅피하기  문서에서추출한단어의경우경우의미성이정확한긴단어보다모호한짧은단어가태그로선정될수있음(Term Weighting)  긴단어위주로태깅필요: 공백을접으면서기존단어와비교처리(?)  쿼리와친밀도높은문서태그선정(이해도, 단어접근성)  문서에서추출된태그는사용자가이해하기쉽지않을수있음  쿼리에서추출된단어로문서의태그를선정해야함(필터링,변환)  Scene#3  오픈검색페이지의상업화방지와악의적투표의관리방안 [제안서] 주제검색과 오픈검색 - 민병국 27
  • 28. 쿼리클러스터링  쿼리전처리  세션ID 부여, 키워드추출  동일세션내빈도계산  키워드간연관성계산및의미클러스터링  각주제간충분한이격필요  유사주제와관련주제, 하위주제의구분  단어클러스터링, 구조적클러스터링  유사어, 관련어, 하위어구분 방송사고 라디오 방송사고 KBS 방송사고 서민정 방송사고 동일세션 [제안서] 주제검색과 오픈검색 - 민병국 28
  • 29. 하부그래프2~7간선무게합: 14.2520 단어클러스터링  연관도기준단어“허브” –ZMI 2.2 이상 가정의료기기 간병용품 medi mall 의료용품 아로마 목욕용품 아로마테라피 공유기 네트워크 랜카드 라우터 건강보조식품 하부그래프1간선무게합: 68.3576 하부그래프8간선무게합: 60.5544 하부그래프11간선무게합: 7.8032 하부그래프15간선무게합: 7.4993 하부그래프2~7간선무게합: 14.2520 하부그래프2~7간선무게합: 60.5544 하부그래프2~7간선무게합: 14.2520 하부그래프9,10간선무게합: 7.8032 하부그래프14간선무게합: 7.4993 하부그래프13간선무게합: 7.4997 하부그래프12간선무게합: 7.4997 [제안서] 주제검색과 오픈검색 - 민병 29 국
  • 30. 문서자동태깅  문서태깅  문서의태그및연관도를색인항목으로포함  쿼리로부터추출된단어와많이매칭되어야함  사용자정의태그또는운영자정의태그도포함  태그선정  집단지능을이용: 사용자클릭문서에대해쿼리를태깅  문서내중요단어를이용한태깅(정보량측정)  문서전체, 구간별또는문단단위단어선정  사전을이용한중요단어필터링 [제안서] 주제검색과 오픈검색 - 민병국 30
  • 31. 통검쿼리기본통계  전체데이터  세션당약3회이상이므로세션을하나의트랜잭션(동시발생사건)으로처리가능함  첫번째쿼리를이후쿼리가포함하는세션내쿼리데이터  확장쿼리(재쿼리포함?)의사용비율을보기위한통계  확장검색사용자비율(세션비율)은전체의약22%  확장검색에사용된쿼리또한전체의약10% 22%의세션에서같은주제를찾기위해평균2회이상쿼리했음을보여줌 [제안서] 주제검색과 오픈검색 - 민병국 31 세션수 유일쿼리수 쿼리회수 세션당 평균쿼리회수 세션당 최대쿼리회수 5/8일자 1,345,501 1,606,571 3,805,716 2.8285 20 5/9일자 1,333,035 1,578,911 3,783,449 2.8382 20 5/10일자 1,291,959 1,484,076 3,711,609 2.8728 20 세션수 세션 전체비율 유일쿼리수 유일쿼리 전체비율 세션당 평균쿼리회수 세션당 최대쿼리회수 5/8일자 295,403 21.95% 156,632 9.75% 1.2788 17 5/9일자 294,027 22.06% 152,674 9.67% 1.2775 19 5/10일자 289,149 22.38% 144,212 9.72% 1.2861 19
  • 32. 통검쿼리–확장쿼리사례 [제안서] 주제검색과 오픈검색 - 민병국 32 순서 쿼리 1 곡물 2 곡물가격 3 곡물 4 곡물콘플라이크 5 세계1위곡물수출국 6 세계3위곡물수출국 7 세계4위곡물수출국 8 세계5위곡물수출국 9 세계6위곡물수출국 10 세계7위곡물수출국 11 세계1위곡물수출국 12 세계2위곡물수출국 13 쌀주요수입국현황 14 곡물주요수입국현황 15 곡물주요수입국 16 최근곡물값이치솟은이유 17 네이버 순서 쿼리 1 피자 2 피자헛 3 피자 4 중곡동피자배달 5 군자동피자배달 6 피자119 7 군자동피자집 8 군자역근처피자집 9 군자역근처맛있는피자집 10 군자역근처피자집 11 군자역피자집 12 중곡동피자집 13 군자피자집 14 군자역피자집 15 피자주문 16 새벽2시피자배달 17 피자 순서 쿼리 1 소고기협상의교휸 2 소고기협상의교훈 3 3등급소고기 4 미국호주소고기수입 5 미국은호주소고기수입 6 소고기협상의문제 7 소고기협상내용 8 이정우 9 이정우교수 ?  이정우교수소고기 순서 쿼리 1 광우병 2 광우병증상 3 광우병 4 광우병소 5 광우병
  • 33. 통검쿼리상위리뷰(1/2)  2008.5.8일자1-150위(40634회~870회)  Kang and Kim 2003 논문: 질의유형에맞추어검색효율을높이려는연구 [제안서] 주제검색과 오픈검색 - 민병국 33 구분 개수 쿼리 사이트찾기(네비게이션) 99 네이버/ 사이월드/ 옥션/ 야후/ 국민은행/ 온에어/ g마켓/ 와와디스켓/ 우리은행/ 엣홈/ 더쇼룸/ 파일코리아/ 지마켓/ 신한은행/ 집코리아/ cgv / 인터파크/ 다음/ 네이트/ 구글/ 넷마블/ 이로모/ 네이트온/ 한게임/ 농협인터넷뱅킹/ kbs / 농협/ 세이클럽/ 서든어택/ mbc / 위디스크/ 판도라tv / 엠파스/ 아이템매니아/ 삼성카드/ 던파/ 팍스넷/ 보배드림/ 아이템베이/ 롯데닷컴/ 파란/ 파일노리/ 하나은행/ 대한항공/ 워크넷/ sbs / 신한카드/ 롯데시네마/ 멜론/ 현대카드/ 곰플레이어/ 피망/ 국민은행인터넷뱅킹/ 와우인벤/ 기업은행/ 스포츠조선/ 미래에셋증권/ 다나와/ ktf / 삼성전자/ 버디버디/ 알바몬/ 교보문고/ 외환은행/ 이랜드노동조합/ 이랜드일반노동조합/ 십이지천2 / gs홈쇼핑/ 와우메카/ 현대자동차/ 동양종금/ 메이플스토리/ 판도라/ 아고라/ 조선일보/ 사람인/ 스포츠서울/ 소리바다/ sk텔레콤/ 국세청/ 롯데카드/ 부동산114 / 리니지/ 롯데백화점/ 모키/ 싸이월드미니홈피/ 클럽박스/ t월드/ 홀인원비뇨기과/ 이마트/ 벅스뮤직/ 롯데홈쇼핑/ 신한은행인터넷뱅킹/ 엠파일/ 교차로/ 애니콜/ 벼룩시장 정보찾기(뉴스,질의응답) 26 야마다유/ 문지은/ 이명박/ 조경태/ 이명박탄핵/ 지수원/ 광우병/ 오구리순/ 이계진/ 소녀시대/ 박용하/ 후(신인가수)/ 빅뱅/ 쇠고기청문회/ 박선주/ 김시향/ 다나카미호/ 화분(알렉스노래)/ 송윤아/ 어버이날/ 정운천/ 창업/ 진중권/ 이토히데아키/ 청문회/ 알렉스 트랜잭션(서비스찾기) 25 이명박탄핵서명/ 아이언맨/ 환율/ 지하철노선도/ 스피드레이서/ 옥션정보유출확인방법/ 날씨/ 온에어18회/ 영화/ 100분토론/ 지도/ 웹하드/ 블리치169화/ 로또당첨번호/ stx팬오션/ 삼성중공업/ 아현동마님/ 아빠셋엄마하나/ 일지매/ 너는내운명/ 탄핵서명/ 블리치168화/ 곰플레이어최신버전다운로드/ 우편번호검색/ 로또/
  • 34. 통검쿼리상위리뷰(2/2)  2008.5.8일자1001-1150위(194회~176회)  1~150위와달리정보찾기의비율이높아짐(다른분류쿼리도정보성을띰) [제안서] 주제검색과 오픈검색 - 민병국 34 구분 개수 쿼리 사이트찾기(네비게이션) 50 이그잼/ 아틀란티카/ 여행박사/ www.naver.com / 뽀람/ 인천공항/ 한메일/ 레포트월드/ 한미르/ 성균관대학교/ 강남구청/ 경희대학교/ 따따따/ 하나은행인터넷뱅킹/ 스포츠토토/ 인터파크티켓예매/ 매일경제신문/ 폴더플러스/ 우체국인터넷뱅킹/ 카스온라인/ 프리챌/ imbc / 라그나로크/ 힌국방송통신대학교/ 노스페이스/ 경남은행/ 매일경제/ 피파/ 텐바이텐/ 게임엔젤/ 농수산홍쇼핑/ 커리어/ tvn / 서프라이즈/ 엄나구모성형외과/ 이랜드복지재단/ 복지넷/ 엽스샵/ 신문/ 바보몰/ 이랜드스토리/ 스킨푸드/ 크레딧뱅크/ 굿모닝신한증권/ 씨네월컴/ slr클럽/ 디그/ 바이크마트/ 영풍문고/ 뮤직온 정보찾기(뉴스,질의응답) 71 고아라폰/ 브라운아이드걸스/ 이랜드프란시아/ 이랜드프란시아가구/ 미쓰라진막말/ 맨유/ 두산베어스/ 최수지/ 뮤/ 가슴확대/ 멘유경기일정/ 맛집/ 여행사/ 어머님은혜/ 한예슬/ 장동건/ 스타킹코니탤벗/ 싸이클론/ 아이팟/ 윤하/ 알렉스신애/ 박명수/ 중고차시세표/ 이계인/ 부산국제모터쇼/ 나비/ 신규폰게임/ 에임하이/ 보건복지부/ 박용하성형전후/ 장나라/ 로체/ 독도/ 서커스mc몽/ 채연/ 뽀로로/ 온에어ost / 이랜드그룹/ 편성표/ 루이비통/ 스승의날/ 김동욱/ 야마시타토모히사/ 전지현/ 자위/ 문국현/ 고전게임/ 모바일게임/ 기숙학원서울대반/ 이랜드상품권/ 자전거/ 기숙학원수능선행반/ 춘자네/ 닌텐도ds게임다운/ 이무송/ 기숙학원연고대반/ 인터넷소설/ 기숙학원재수선행반/ 고용보험/ 김구라/ 의료보험민영화/ 안소희/ 컨버스/ 로버트다우니주니어/ 조경태의원/ 청미/ 이력서/ 이랜드할인매장/ 이랜드월드/ 이랜드지식경영/ 클래지콰이 트랜잭션(서비스찾기) 29 아내의반란/ 시계/ 원피스353화/ 온에어마지막회/ 음악/ 우산(윤하노래)/ 삼성테크윈/ 우편번호찾기/ 토토브라우저/ 쥬얼리모두다쉿다운/ 우리결혼했어요다시보기/ 스타크래프트립버전100%다운로드/ 알씨/ 가격비교/ 현대미포조선/ 남자쇼핑몰/ 이승기추억속의그대/ 곰플레이어다운로드/ 가십걸16화/ 춘자네경사났네/ 은혼105화/ 서든어택10킬소리/ 멜랑꼴리/ sg워너비라라라다운/ 데몬/ 색계/ 막돼먹은영애씨시즌3 / 코스피지수/ 색시몽/
  • 35. 포함쿼리vs포함세션  장바구니범위정의  특정키워드를포함한쿼리데이터만사용?  세션당평균쿼리회수: 1.4회  특정키워드를포함한세션내모든쿼리데이터사용?  세션당평균쿼리회수: 2.75회  약6배보다많은유일쿼리수: 연관단어의recall 증가 [제안서] 주제검색과 오픈검색 - 민병국 35 키워드“이명박” 포함쿼리만사용 포함세션내모든쿼리사용 데이터일자 세션수 유일쿼리수 쿼리회수 유일쿼리수 쿼리회수 5/8(목) 13,455 1,877 18,999 12,574 37,145 5/9(금) 11,358 1,667 15,658 10,444 30,762 5/10(토) 8,941 1,481 12,448 9,383 25,167 5/11(일) 6,879 1,175 9,574 7,384 19,065 5/12(월) 7,173 1,394 10,056 7,956 19,914 5/13(화) 6,508 1,309 9,282 7,219 17,788
  • 36. “이명박”관련쿼리량변화(1~30위) [제안서] 주제검색과 오픈검색 - 민병국 36 쿼리 세션수 쿼리회수 탄핵서명 6868 7094 탄핵 2500 2618 미니홈피 528 535 아고라 486 509 탄핵서명조작 356 358 아고라탄핵서명 341 348 지지율 311 312 노무현 268 282 아고라탄핵 239 245 광우병 232 239 네이버 226 226 독도 181 216 독도포기 186 207 탄핵을위한범국민운동본부 193 194 안티카페 167 169 되고송 148 163 이 153 155 탄핵서명사이트 136 143 소고기 133 134 청와대 124 124 싸이월드 117 120 안티 112 119 조경태 112 116 이계진 112 115 촛불집회 98 101 아고라서명운동 97 99 탄핵서명아고라 78 97 쇠고기청문회 90 95 100분토론 89 90 탄핵송 85 85 ■5/8 (목) 일자데이터 ■5/9 (금) 일자데이터 ■5/12 (월) 일자데이터 쿼리 세션수 쿼리회수 탄핵서명 5835 6051 탄핵 1983 2075 아고라 586 611 아고라탄핵서명 552 566 미니홈피 437 444 지지율 301 313 탄핵서명조작 267 267 노무현 214 226 광우병 205 217 네이버 185 189 100분토론 185 188 되고송 148 173 독도 143 156 탄핵을위한범국민운동본부 150 151 이 148 148 탄핵서명사이트 124 129 청와대 124 126 아고라탄핵 122 124 촛불집회 122 122 안티 108 117 독도포기 104 110 탄핵서명아고라 85 98 소고기 92 92 이계진 81 81 국회 79 79 아고라서명운동 78 79 탄핵송 75 79 인터넷종량제 72 79 오마이뉴스 75 77 싸이월드 73 74 쿼리 세션수 쿼리회수 탄핵서명 3420 3523 탄핵 1186 1242 아고라탄핵서명 347 353 아고라 323 342 미니홈피 309 313 지지율 224 231 노무현 173 185 탄핵서명조작 154 155 광우병 125 131 네이버 100 102 안티 96 99 되고송 86 97 탄핵서명사이트 80 93 국회 83 85 독도 75 85 탄핵을위한범국민운동본부 77 79 청와대 75 77 아고라탄핵 69 72 이 66 66 박근혜 59 65 촛불문화제 59 61 독도포기 52 56 탄핵송 51 55 일지매 51 53 싸이월드 47 50 pd수첩 41 43 문국현탄핵 39 42 탄핵서명아고라 38 42 안티카페 39 41 야후 38 40 탄핵 독도 광우병 지지율 노무현 탄핵서명 소고기 촛불집회
  • 37. “노무현”관련쿼리량변화(1~30위) [제안서] 주제검색과 오픈검색 - 민병국 37 쿼리 세션수 쿼리회수 이명박 193 207 청문회 147 158 사람사는세상 146 147 이명박탄핵서명 129 133 예언 91 93 홈페이지 69 70 조경태 60 70 봉하마을 56 61 이명박탄핵 54 55 김대중 31 32 대통령 27 29 미니홈피 28 28 탄핵이유 27 27 5공청문회 25 26 청문회전두환 23 25 탄핵 22 23 이명박지지율 21 23 지지율 22 22 유시민 22 22 노간지 21 22 고개숙인 21 21 연설 21 21 전두환 20 20 명패 20 20 이라크방문 14 20 청와대 19 19 네이버 18 19 다큐3일 14 18 이명박미니홈피 17 17 100분토론 17 17 ■5/8 (목) 일자데이터 ■5/9 (금) 일자데이터 ■5/12 (월) 일자데이터 쿼리 세션수 쿼리회수 이명박 145 160 사람사는세상 122 123 이명박탄핵서명 108 111 예언 103 103 홈페이지 83 86 봉하마을 46 48 청문회 44 44 이명박탄핵 34 34 조경태 33 34 이명박미니홈피 31 32 노간지 23 26 이명박지지율 25 25 김대중 24 25 연설 24 25 탄핵이유 23 23 탄핵 22 23 kbs 21 23 전두환 20 22 쇠고기 20 20 미니홈피 20 20 광우병 20 20 유시민 19 20 청와대 19 20 청문회전두환 19 19 박근혜 18 18 독도연설 16 18 shangus 17 17 봉화마을 14 17 조중동 13 17 이계진 15 16 쿼리 세션수 쿼리회수 사람사는세상 120 124 이명박 113 120 이명박탄핵서명 103 106 예언 53 57 홈페이지 52 55 봉하마을 50 53 김대중 28 29 유시민 27 29 동영상 25 26 전두환 22 25 이명박탄핵 23 23 이명박미니홈피 21 21 탄핵 19 19 이해찬 17 18 대통령 16 18 네이버 17 17 박근혜 16 17 청문회 16 17 청와대 16 17 오마이뉴스 16 16 연설 16 16 미니홈피 15 15 shangus 15 15 노간지 14 15 이명박지지율 14 14 노태우 13 14 kbs 11 14 김영삼 13 13 독도연설 12 13 광우병 12 13 이명박 사람사는세상 봉하마을 예언 홈페이지 전두환 청문회 노간지 대통령 독도연설
  • 38. 쿼리의연관단어리콜향상  쿼리에사용된단어  여러하부주제를포함하는가장작은길이의단어  전문성또는가장하부주제를나타내는특정단어  단어의구분  광의의기본단어  협의의확장단어  단어의출처  광의의기본단어는여러문서에분포되어있음  협의의확장단어는입소문또는어떤문서의출처를갖음  쿼리의연관단어추출  의미연결이끊겨있는쿼리로만으로는연관단어연결부적절  협의의확장단어의출처문서로부터쿼리의연관단어를연결수집  빈도가낮아연결되지못하는단어를문서로부터수집  쿼리와문서를자동으로연결해나가는과정을반복하며구성됨  쿼리의문서모델과문서의쿼리모델을병합하는효과 [제안서] 주제검색과 오픈검색 - 민병국 38