SlideShare a Scribd company logo
1 of 50
Download to read offline
ACADEMIC TREND ANALYTICS SERVICE
SOFTWARE MAESTRO 9기
김정은, 이일섭, 한건호
Discover trends in scientific research.
EASY, FAST, VISIBLE!
2
Discover trends in scientific research.
EASY, FAST, VISIBLE!
3
Discover trends in scientific research.
EASY, FAST, VISIBLE!
4
Discover trends in scientific research.
EASY, FAST, VISIBLE!
5
Discover trends in scientific research.
EASY, FAST, VISIBLE!
6
Discover trends in scientific research.
EASY, FAST, VISIBLE!
DATA ANALYSIS & AI &VISUALIZATION
7
TABLE LIST
▸ PROBLEM?
▸ SOLUTION.
▸ HOW?
▸ SYSTEM DESIGN
▸ BUSINESS
▸ FUTURE PLAN
▸ SERVICE USE
8
PROBLEM?
9
PROBLEM?무슨 키워드를 찾아봐야하지?
수많은 논문자료들 중요한 논문은 대체 뭐지? 놓친 논문은 없을까?
내 연구분야의 트렌드를 제대로 알고 있는건가?
10
11
PROBLEM
학술자료의 빅데이터화
307
445
506
 510
594
831
1,281
0
325
650
975
1,300
1,625
2011
 2013
 2015
 2017
“machine learning & image recognition”
으로 검색된 논문 수, IEEE
1970~2005년까지 검색 논문수 : 1013개 < N_2017
출판 전 논문 저장소인 arXiv
2018년 5월에만 12000건 이상 게시
12
PROBLEM
기존 서비스의 부적합성
13
RESEARCHER INTERVIEW
“어떤 키워드로 찾느냐가 정말 중요하다. 키워드 선택에 따라
서 결과가 확확 달라지는데, 연구한지 1년이 지나서야 처음 보
는 대중적인 키워드를 발견하기도 한다.”



서울대, 석박사과정 5년차, 자동차엔진연구실
“내가 연구하고 있는 분야의 비교군(비슷한 연구를 하는 집단)
의 동향과 자료를 한번에 찾고 싶은데 쉽지않다.”



성균관대, 학부연구생 CTl
“Google Scholar는 트렌드 변화를 파악하기에 적합하지 않
은 것 같다. 내가 하고 있는 분야의 동향을 알고 싶은데 굉장히
많은 시간이 걸리고 제대로 파악하고 있는지도 모르겠다.”



서울대, 석박사과정 5년차, 로보틱스 연구실
PROBLEM 14
SOLUTION.
15
SOLUTION
1. 태그 기반 검색 시스템
StackExchange(Q&A Network + StackOverflow)
The World’s largest programming community
16
SOLUTION
2. 학술 데이터 자동 분석, 주요 동향 전달
17
SOLUTION
3.주요변화 트래킹 인지 수단 제공
18
SOLUTION
“어떤 키워드로 찾느냐가 정말 중요하다. 키워드 선택에
따라서 결과가 확확 달라지는데, 연구한지 1년이 지나서
야 처음 보는 대중적인 키워드를 발견하기도 한다.”



서울대, 석박사과정 5년차, 자동차엔진연구실

“내가 연구하고 있는 분야의 비교군(비슷한 연구를 하는
집단)의 동향과 자료를 한번에 찾고 싶은데 쉽지않다.”



성균관대, 학부연구생 CTl

“Google Scholar는 트렌드 변화를 파악하기에 적합
하지 않은 것 같다. 내가 하고 있는 분야의 동향을 쉽게 알
고 싶은데 굉장히 많은 시간이 걸리고 제대로 파악하고
있는지도 모르겠다.”



서울대, 석박사과정 5년차, 로보틱스 연구실
정제된 학술 키워드 태그셋 구축 :
태그 기반 검색


학술 데이터 자동 분석, 

주요 동향 전달




주요 동향 변화 트래킹 

인지 수단 제공
19
HOW?
20
수행 내용
▸ 데이터 수집 및 정제 자동화
▸ 학술 키워드 태그셋 구축
▸ 데이터 분석 및 시각화
▸ 웹 서비스 개발
▸ 프로젝트 매니지먼트

팀 개발 자산 운영, CI/CD 시스템 구축, 웹 배포과정 체계화
HOW 21
1. 데이터 수집 및 정제 자동화
SCOPUS 

: SCI
ArXiv 

: Open Journal
“ 신뢰성 높은 데이터 확보 및 자동화”
HOW 22
1. 데이터 수집 및 정제 자동화
데이터 수집 자동화 도식도
HOW 23
1. 데이터 수집 및 정제 자동화
데이터 정규화 도식도
HOW 24
1. 데이터 수집 및 정제 자동화
569,083
1,008,021
HOW 25
2. 학술 키워드 태그셋 구축
학술자료의 저자 키워드 특성
“같은 뜻의 다양한 형태의 키워드 => 하나의 일관된 태그”
HOW 26
2. 학술 키워드 태그셋 구축
HOW 27
HOW
2. 학술 키워드 태그셋 구축
28
HOW
2. 학술 키워드 태그셋 구축
309,969
29
HOW
3. 데이터 분석 및 시각화
시계열 분석
네트워크 분석
“연구자에게 필요한 주요 동향 정보에 대한 유의미한 분석 및 전달”
30
HOW
3. 데이터 분석 및 시각화
DATA VIZ OPENSOURCE : D3
“연구자에게 필요한 주요 동향 정보에 대한 유의미한 분석 및 전달”
31
HOW
4.웹 서비스 개발
JS + D3 + REACT
“유저의 사용성과 정보전달력”
https://mater.cerebroscholar.com
32
HOW
5. 프로젝트 매니지먼트
Trello
33
HOW
5. 프로젝트 매니지먼트
Github
34
HOW
5. 프로젝트 매니지먼트
CI/CD 시스템 구축
https://travis-ci.org/CerebroScholar/Cerebro.Scholar.Web.Rehearsal
35
HOW
5. 프로젝트 매니지먼트
웹 배포과정 체계화
https://master.cerebroscholar.com
https://development.cerebroscholar.com
https://staging.cerebroscholar.com
https://cerebroscholar.com
36
SYSTEM DESIGN
37
전체 시스템 구성도
SYSTEM DESIGN 38
개발 환경
구분 항목 세부 내용
S/W

개발환경
개발언어 Python
데이터 크롤링 및 데
이터 전처리
개발언어 R, Python 데이터 분석
개발언어 Java Script, D3.js
웹-앱 개발, 데이터
분석 및 시각화
오픈소스 React.js
컴포넌트 기반 웹 개
발
DB 관계형 DB
인용관계 기반의 학
술자료 데이터 저장
서버환경 AWS
Cloud 기반 서버 구
축
SYSTEM DESIGN 39
BUSINESS
40
BUISENESS MODEL
Journal/Conference Ad

MooC Ad
BUSINESS 41
MARKET ANALYSIS
•  Annual STM English language journal revenues 

: US 10 billion in 2013, CAGR 4.5% (US 8 billion in 2008 )
•  Open Access Market 

: US 290 million in 2015, CAGR 15%
Growth in open access content in PubMed Central
BUSINESS 42
Users 15+ million (+ 5000/month)
Funding 87.6M$
Sale 3.8M$
Business Model 무료 서비스 + 타게팅 광고
Ex) 연구자와 기업사이의 리쿠르팅 매칭, 연구장비
43
FUTURE PLAN
44
향후 발전 계획
▸ Deep Learning을 활용한 keyphrase 추출
▸ 정제 고도화(Duplication control 고도화)
▸ 대용량데이터 처리 개선
▸ Agile개발 진행
FUTURE PLAN 45
SERVICE USE
46
https://master.cerebroscholar.com
47
END. 감사합니다
48
참고
About cerebro scholar

More Related Content

Similar to About cerebro scholar

Enterprise Knowledge Management And Emerging Technologies
Enterprise Knowledge Management And Emerging TechnologiesEnterprise Knowledge Management And Emerging Technologies
Enterprise Knowledge Management And Emerging Technologiescalcutta
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망Open Cyber University of Korea
 
Product Design System 2009, Team Shabu Final Documentation
Product Design System 2009, Team Shabu Final DocumentationProduct Design System 2009, Team Shabu Final Documentation
Product Design System 2009, Team Shabu Final DocumentationJongBum Woo
 
디포커스 전홍구
디포커스 전홍구디포커스 전홍구
디포커스 전홍구Newsjelly
 
데이터 시각화 그리고 과학
데이터 시각화 그리고 과학데이터 시각화 그리고 과학
데이터 시각화 그리고 과학Hanyang University
 
과학데이터와연구소재
과학데이터와연구소재과학데이터와연구소재
과학데이터와연구소재Suntae Kim
 
과학데이터와연구소재
과학데이터와연구소재과학데이터와연구소재
과학데이터와연구소재Suntae Kim
 
DISC 기본계획서
DISC 기본계획서 DISC 기본계획서
DISC 기본계획서 Han Woo PARK
 
[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자neuroassociates
 
Disc 2015 보도자료 (휴대폰번호 삭제-수정)
Disc 2015 보도자료 (휴대폰번호 삭제-수정)Disc 2015 보도자료 (휴대폰번호 삭제-수정)
Disc 2015 보도자료 (휴대폰번호 삭제-수정)Han Woo PARK
 
Second week, what is an Artivicial Inteligence?.pdf
Second week, what is an Artivicial Inteligence?.pdfSecond week, what is an Artivicial Inteligence?.pdf
Second week, what is an Artivicial Inteligence?.pdfssuser5a82521
 
Peopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start todayPeopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start todayYoungchan Jo
 
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)Yan So
 
Src10대 과제 - 1. 총괄파트
Src10대 과제 - 1. 총괄파트Src10대 과제 - 1. 총괄파트
Src10대 과제 - 1. 총괄파트SRCDSC
 
코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)
코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)
코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)Tae Young Kang
 
머신러닝의 개념과 실습
머신러닝의 개념과 실습머신러닝의 개념과 실습
머신러닝의 개념과 실습Byoung-Hee Kim
 
20141215 액션러닝 원장님강의08
20141215 액션러닝 원장님강의0820141215 액션러닝 원장님강의08
20141215 액션러닝 원장님강의08humana12
 
실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루Jaimie Kwon (권재명)
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터JM code group
 
Week1 ot
Week1 otWeek1 ot
Week1 otEun Yu
 

Similar to About cerebro scholar (20)

Enterprise Knowledge Management And Emerging Technologies
Enterprise Knowledge Management And Emerging TechnologiesEnterprise Knowledge Management And Emerging Technologies
Enterprise Knowledge Management And Emerging Technologies
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망
 
Product Design System 2009, Team Shabu Final Documentation
Product Design System 2009, Team Shabu Final DocumentationProduct Design System 2009, Team Shabu Final Documentation
Product Design System 2009, Team Shabu Final Documentation
 
디포커스 전홍구
디포커스 전홍구디포커스 전홍구
디포커스 전홍구
 
데이터 시각화 그리고 과학
데이터 시각화 그리고 과학데이터 시각화 그리고 과학
데이터 시각화 그리고 과학
 
과학데이터와연구소재
과학데이터와연구소재과학데이터와연구소재
과학데이터와연구소재
 
과학데이터와연구소재
과학데이터와연구소재과학데이터와연구소재
과학데이터와연구소재
 
DISC 기본계획서
DISC 기본계획서 DISC 기본계획서
DISC 기본계획서
 
[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자[week6] 데이터읽어주는남자
[week6] 데이터읽어주는남자
 
Disc 2015 보도자료 (휴대폰번호 삭제-수정)
Disc 2015 보도자료 (휴대폰번호 삭제-수정)Disc 2015 보도자료 (휴대폰번호 삭제-수정)
Disc 2015 보도자료 (휴대폰번호 삭제-수정)
 
Second week, what is an Artivicial Inteligence?.pdf
Second week, what is an Artivicial Inteligence?.pdfSecond week, what is an Artivicial Inteligence?.pdf
Second week, what is an Artivicial Inteligence?.pdf
 
Peopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start todayPeopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start today
 
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)
전혀 새로운 방법의 데이터 탐색 - 김민수 (Tableau)
 
Src10대 과제 - 1. 총괄파트
Src10대 과제 - 1. 총괄파트Src10대 과제 - 1. 총괄파트
Src10대 과제 - 1. 총괄파트
 
코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)
코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)
코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)
 
머신러닝의 개념과 실습
머신러닝의 개념과 실습머신러닝의 개념과 실습
머신러닝의 개념과 실습
 
20141215 액션러닝 원장님강의08
20141215 액션러닝 원장님강의0820141215 액션러닝 원장님강의08
20141215 액션러닝 원장님강의08
 
실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루실리콘 밸리 데이터 사이언티스트의 하루
실리콘 밸리 데이터 사이언티스트의 하루
 
고대8 9주 빅데이터
고대8 9주 빅데이터고대8 9주 빅데이터
고대8 9주 빅데이터
 
Week1 ot
Week1 otWeek1 ot
Week1 ot
 

About cerebro scholar