1. 웹보메트릭스와 계량정보학
4주차 계량정보학의 실증적 기반
1강. 계량정보학의 실증적 기반(1)
2강. 계량정보학의 실증적 기반(2)
영남대학교 문과대학 언론정보학과
교수 박한우
2. 1. 계량정보학의 실증적 기반에 대해 이해한다.
1. Shepard’s Citation VS SCI
2. SCI의 맥락화: 정보검색과 “언어적 연결”
3. 1. Shepard’s Citation VS SCI
가. SCI(SCIENCE CITATION INDEX)의 기원
가필드(Eugene
Garfield)
과학 연구를 촉진 시키고 과학 커뮤니케이션을
발전 시키기 위해 인용 색인을 고안
SCI
과학인용색인(Science Citation Index, SCI®)은 미국의 ISI(Institute of Scientific
Information)에서 1960년에 만든 인용 색인이다. 지금은 Thomson Reuters가
소유하고 있다.
SCI 확장판(SCIE, Science Citation Index Expanded)도 있다. 주로 영어로 된
저널들이 등재되어 있다.
우리나라교육과학기술부에서 각 대학의 연구능력을 평가할 때 "SCI급
논문횟수"를 집계하는데, 이 때의 SCI급에는 SCI, SCIE, SSCI, A&HCI를
말한다.
보다 상세한 정보는 http://thomsonreuters.com/web-of-science/
http://ko.wikipedia.org/wiki/%EA%B3%BC%ED%95%99%EC%9D%B8%EC%
9A%A9%EC%83%89%EC%9D%B8
4. 1. Shepard’s Citation VS SCI
출처 - http://science.thomsonreuters.com/cgi-bin/jrnlst/jloptions.cgi?PC=K
6. 1. Shepard’s Citation VS SCI
나. Shepard’s Citation
Shepard’s Citation
• 선례 구속성의 원리(Stare decisis)
• 어떠한 사건에 대하여 판결을 내리는 상급 법원의 판결은 그
이후 발생하는 동일하거나 유사한 사건에 대하여 구속력을
가진다는 원리
• 1860년 캘리포니아 주 판결문에 대한 인용색인(Shepard’s
Citation)이 등장
7. 1. Shepard’s Citation VS SCI
구분
대상
인용
네트워크
문헌의
유효성
Shepard’s Citation
SCI
판례
(과학)문헌
인용 네트워크를 구축할 수 있는 단서를
제공하지 않는다
인용색인은 더하기 또는 빼기 부호로
판결문을 단순히 연결
과학논문은 사회인지적
링크로 연결
자체적인 문맥 분석을 통하여 시간이
지나면서 각 판례가 유효한지 여부를
분명하게 표시
학술 문헌과 달리 선급 판례는 이후
판결에 따라 확증되거나 기각
유효한지 여부를 분명하게
표시하지 않음
8. 2. SCI의 맥락화: 정보검색과 “언어적 연결”
인용색인은 정보검색 연구의 전통에 뒤섞여 있는 과학 문헌을
조직화하는데 개념적으로 혁신적인 도구뿐만 아니라 적합성에 관한
새로운 아이디어를 제공
가. 문헌(Document)
• 정보 순환이 가진 위험 속에서 지식이 기록되고 전달되는 물리적
표현
• 서술과 묘사로 여겨지는 대상을 포함하는 “정보”에 대한 폭넓은
정의에 충실
• 간단히 이야기하면 문헌에 담긴 모든 것을 포괄하는 분류의 유일한
부분집합, 즉 기록된 원문을 포함하는 문헌에 집중하자는 것.
9. 2. SCI의 맥락화: 정보검색과 “언어적 연결”
나. 문헌 정보 검색 시스템
• 특정 문헌에 대한 지시자의 역할을 하는 문헌 대리자 또는
색인어를 생성해서 별도의 아카이브에 저장해야 함.
다. 문헌 대리자
• 저자명이나 주제명 표목(Subject heading)과 같은 표제어
• 동일 저자가 저술한 모든 도서 또는 특정 주제에 관한 모든
도서처럼 이 표제어가 지정하는 특정 속성을 공유하는 물리적
형태를 가진 모든 도서를 가리킴.
10. 2. SCI의 맥락화: 정보검색과 “언어적 연결”
라. 색인
• 수작업이든 자동화된 정보검색이든 상관없이 정보검색을
구성하는 기본 요소.
• 문헌 자체(전문,초록,제목)에서 색인어를 추출하거나 수작업으로
색인자가 텍스트를 해석하여 색인어를 부여할 수 있음.
11. 2. SCI의 맥락화: 정보검색과 “언어적 연결”
마. 색인어
• 색인어를 텍스트 자체로부터 추출한다면, 저자와 이용자가
동일하거나 유사한 개념을 표현하는데 전혀 다른 단어를 사용할 수
있기 때문에 거의 쓸모가 없을 수 있음.
• 반면에 사람이 색인자로서 중재한다면 색인어의 균일성과
일관성은 개선.
• 전문검색 시스템(Full-text retrieval system)
• 컴퓨터는 언어적 내용을 분석
• 이용자의 요구를 기계적으로 읽을 수 있게 식별
• 서로간의 비교를 통해 검색
12. 2. SCI의 맥락화: 정보검색과 “언어적 연결”
바. 자동색인
1) 역파일(Inverted file)
검색 가능한 모든 텍스트에 대한 모든 색인어를 포함
2) 카드 천공기(Key punching) 방식
텍스트를 기계 가독형으로 변환하기 위해 선호하던 방식
IBM의 연구원 한스 피터룬(Hans Peter Luhn)
1. 통계적 확률에 기초하여 단어를 이용하여 생각을 전달한다.
2. 논문에서 단어발생빈도는 단어의 유의도(Word significance)를
측정할 수 있는 유용한 도구를 제공한다.
13. 2. SCI의 맥락화: 정보검색과 “언어적 연결”
SMART와 크랜필드의 실험
• Salton’s Magic Automatic Retriever of Text) &
크랜필드(Cranfield)의 실험으로 어구(phrase)는 색인 도구로서
단일어보다 훨씬 덜 우수하며, 지나치게 복잡한 분석도구는
기대했던 것보다 효과적이지 않다 라는 것을 보여주었다.
14. 2. SCI의 맥락화: 정보검색과 “언어적 연결”
사. 어휘분석
• 어휘 분석을 통해 잘 구현된 시스템이라면 Encyclopedia 와
Encyclopaedia의 구별하지 않고 동일한 어휘로 봄.
아. 구문 분석
• 자연어로 된 텍스트 단어는 구문 규칙에 따라 구, 절, 문장과
연결되어있음.
• 따라서 효과적인 자동 색인 시스템은 유의한 텍스트 조각에 문법
구조를 부여함으로써 단순히 단어 출현빈도를 계산하는 것 이상의
능력을 갖춘 “파서(parser)”라는 모듈을 구현해야함.
• Transformational parser
15. 2. SCI의 맥락화: 정보검색과 “언어적 연결”
자. 의미 분석
• 구문적으로 정렬된 문장으로 체계화된 단어는 각기 본래의 개념을
가지고 있지만 이들 개념은 본래 단어나 문장 안에서 동일한
의미를 “내포하지는” 않음.
• 동일한 약품에 대해 화학명과 제품명이 다른 경우
16. QUIZ.
어구(phrase)는 색인 도구로서 단일어보다 훨씬 덜 우수하며, 지나치게
복잡한 분석도구는 기대했던 것보다 효과적이지 않다 라는 것을 보여준
실험은 무엇인가?
SMART와 크랜필드의 실험
17. 정리하기.
SCI는 가필드(Eugene Garfield가 과학 연구를 촉진 시키고 과학
커뮤니케이션을 발전 시키기 위해 고안한 인용 색인시스템이다.
인용색인은 정보검색 연구의 전통에 뒤섞여 있는 과학 문헌을
조직화하는데 개념적으로 혁신적인 도구뿐만 아니라 적합성에 관한
새로운 아이디어를 제공한다.