SlideShare uma empresa Scribd logo
1 de 14
Mar 2015
권재명
데이터 분석의 길 1.
“고수는 생선 잡는 법을 알고있다”
(검색과 영어)
“생선을 주면 하루 먹거리가 해결되지만, 생선 잡는 법을 가르치면 평생 먹고살수있다
(give a man a fish and you feed him for a day; teach a man to fish and you feed him
for a lifetime)”—속담
문제 설정
R에서 자료를 읽어들였는데 시간컬럼이 표준시간대(UTC) 였다.
그 자료를 태평양 시간대로 바꿔서 출력하고 싶다.
1. 국내 검색엔진에서 “r에서 시간대 변환”을 검색한다.
2. 도움이 되는 검색 결과가 보이지 않는다.*
3. 영어 표현을 알아낸다. “r convert time zone”.
4. 국내 검색엔진에서 “r convert time zone”을 검색한다.
5. 아직도 큰 도움이 되지 않는다.*
6. ... (어떻게 하나?)
* 화면캡춰 생략
문제해결 노력 (우리나라의 경우)
1. “How do I convert time zone in R? Let’s Google
it by typing ‘r convert time zone’”
2. 일부를 입력했을때 자동완성 (autocomplete)을
통해 이미 많은 분석가들이 같은 내용을 질문한
것을 알 수 있다. 더불어 유사한 검색 문구들도
쓸모가 있는 내용들이다.
3. 결과는 쪽집게. (다음 페이지)
문제해결 노력 (영어권 엔지니어들의 경우)
첫번째 검색 결과에 이미 쓸만한 답이 나와 있다. 다
른 결과들도 도움이 되는 내용들이다.
상황 종료.
정답은:
문제해결 노력 (영어권 엔지니어들의 경우)
영어 콘텐츠. 검색.
데이터분석가 중 많은 사람들이 전혀 책을 통해 R을 배우지 않았다.
질문이 있을때마다 구글로 찾아나가는 것.
데이터 분석의 디테일에 대한 질의-응답 자료는
영어 컨텐츠가 한국말 컨텐츠에 비해 비교할 수 없을 정도로 풍부하다.
영어권 엔지니어가 압도적으로 많은 때문이다.
그리고 영어 컨텐츠를 가장 잘 잡아주는 검색엔진은
현재로는 구글이다.
다른 검색엔진은?
같은 검색을 Microsoft의 bing 에서 실행해 보았다.
자동완성도, 검색 결과도, 아주 만족스럽지는 않다.
하나의 예에 불과하지만, 구글이 사용자들의 이용데
이터를 서비스개선에 사용하는 선순환에 기반하여
타 검색회사들이 따라가기 어려울 정도로 앞서있는
것을 반영한다.
고수가 되려면 필요한 것을 스스로 검색하고,
배워나갈 능력이 있어야 한다.
그 능력의 핵심은 “영어”와 “검색”이다.
그러므로 기술적인 내용들은 영어검색을 생활화하는 것이
고수가 되는 훈련이 된다.
앞으로 질문이 있다면, 일단은 영어로 구글검색!
“고수는 생선 잡는 법을 알고있다”
따름정리: 구글하면 나오는 내용은 적을 필요가 없다
그러므로 앞으로의 슬라이드에서도
구글검색하면 나올 내용은 가급적 피하려고 한다.
(그럼 뭘 쓸건데? -_-; )
연습문제: 그렇다면 R에서 사용할 수 있는 모든 타임존을 나열하려면 어떻게 하
면 될까?
연습문제
사족
영어 검색 키워드를 찾기 위해 구글번역(translate.google.com)을 사용할 수 있다.
이렇게:
그리고 나서 번역된 영문 키워드를 사용해 검색하면 된다.
물론 검색 결과는 또다시 영어문서 -_-; (기계번역이 일반화되기를 기다리며)
영어에 자신이 없다면?
기타 사이
트들
기술적인 질문에 대한 답들은 다음 두 사이
트에 편중된다.
1. 스택 오버플로우(Stack Overflow)와
그 일당들. 특히 크로스 밸리데이티드
(Cross Validated)
2. 위키피디아 (Wikipedia)
영어권 기술 컨텐츠
구글
Stack
Overflow
Wikipedia
기타 사이
트들
기타 사이
트들
엔지니어
이런 형국...
검색

Mais conteúdo relacionado

Destaque

오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA)
오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA) 오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA)
오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA) Yongho Ha
 
[GAMENEXT] 경영자가 알아야 할 게임 서버 개발 과정 - 넷텐션
[GAMENEXT] 경영자가 알아야 할 게임 서버 개발 과정 - 넷텐션[GAMENEXT] 경영자가 알아야 할 게임 서버 개발 과정 - 넷텐션
[GAMENEXT] 경영자가 알아야 할 게임 서버 개발 과정 - 넷텐션GAMENEXT Works
 
Generalized Additive Model
Generalized Additive Model Generalized Additive Model
Generalized Additive Model Jinseob Kim
 
[IGC 2016] 아마존 구승모 - 게임 제작을 위한 Amazon의 편리한 도구들 (게임리프트와 럼버야드)
[IGC 2016] 아마존 구승모 - 게임 제작을 위한 Amazon의 편리한 도구들 (게임리프트와 럼버야드)[IGC 2016] 아마존 구승모 - 게임 제작을 위한 Amazon의 편리한 도구들 (게임리프트와 럼버야드)
[IGC 2016] 아마존 구승모 - 게임 제작을 위한 Amazon의 편리한 도구들 (게임리프트와 럼버야드)강 민우
 
Improving MySQL performance with Hadoop
Improving MySQL performance with HadoopImproving MySQL performance with Hadoop
Improving MySQL performance with HadoopSagar Jauhari
 
Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강
Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강
Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강Donghan Kim
 
General Additive Models in R
General Additive Models in RGeneral Additive Models in R
General Additive Models in RNoam Ross
 
개발자 혼자서 RPG 게임 만들기
개발자 혼자서 RPG 게임 만들기개발자 혼자서 RPG 게임 만들기
개발자 혼자서 RPG 게임 만들기NGMaking
 
개발자를 위한 R로 wordcloud 10분만에 만들기
개발자를 위한 R로 wordcloud 10분만에 만들기개발자를 위한 R로 wordcloud 10분만에 만들기
개발자를 위한 R로 wordcloud 10분만에 만들기동철 박
 
아마존의 관리형 게임 플랫폼 활용하기: GameLift (Deep Dive) :: 구승모 솔루션즈 아키텍트 :: Gaming on AWS ...
아마존의 관리형 게임 플랫폼 활용하기: GameLift (Deep Dive) :: 구승모 솔루션즈 아키텍트 :: Gaming on AWS ...아마존의 관리형 게임 플랫폼 활용하기: GameLift (Deep Dive) :: 구승모 솔루션즈 아키텍트 :: Gaming on AWS ...
아마존의 관리형 게임 플랫폼 활용하기: GameLift (Deep Dive) :: 구승모 솔루션즈 아키텍트 :: Gaming on AWS ...Amazon Web Services Korea
 
OSGeo와 Open Data
OSGeo와 Open DataOSGeo와 Open Data
OSGeo와 Open Datar-kor
 
황성수 공공데이터 개방과 공공이슈 해결
황성수 공공데이터 개방과 공공이슈 해결황성수 공공데이터 개방과 공공이슈 해결
황성수 공공데이터 개방과 공공이슈 해결r-kor
 
Distributed R: The Next Generation Platform for Predictive Analytics
Distributed R: The Next Generation Platform for Predictive AnalyticsDistributed R: The Next Generation Platform for Predictive Analytics
Distributed R: The Next Generation Platform for Predictive AnalyticsJorge Martinez de Salinas
 
Deciphering voice of customer through speech analytics
Deciphering voice of customer through speech analyticsDeciphering voice of customer through speech analytics
Deciphering voice of customer through speech analyticsR Systems International
 
Optimizing Facebook Campaigns with R
Optimizing Facebook Campaigns with ROptimizing Facebook Campaigns with R
Optimizing Facebook Campaigns with RDomino Data Lab
 
Cloud Conf 2015 - Develop and Deploy IOT Applications
Cloud Conf 2015 - Develop and Deploy IOT ApplicationsCloud Conf 2015 - Develop and Deploy IOT Applications
Cloud Conf 2015 - Develop and Deploy IOT ApplicationsCorley S.r.l.
 

Destaque (17)

오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA)
오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA) 오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA)
오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA)
 
[GAMENEXT] 경영자가 알아야 할 게임 서버 개발 과정 - 넷텐션
[GAMENEXT] 경영자가 알아야 할 게임 서버 개발 과정 - 넷텐션[GAMENEXT] 경영자가 알아야 할 게임 서버 개발 과정 - 넷텐션
[GAMENEXT] 경영자가 알아야 할 게임 서버 개발 과정 - 넷텐션
 
Generalized Additive Model
Generalized Additive Model Generalized Additive Model
Generalized Additive Model
 
[IGC 2016] 아마존 구승모 - 게임 제작을 위한 Amazon의 편리한 도구들 (게임리프트와 럼버야드)
[IGC 2016] 아마존 구승모 - 게임 제작을 위한 Amazon의 편리한 도구들 (게임리프트와 럼버야드)[IGC 2016] 아마존 구승모 - 게임 제작을 위한 Amazon의 편리한 도구들 (게임리프트와 럼버야드)
[IGC 2016] 아마존 구승모 - 게임 제작을 위한 Amazon의 편리한 도구들 (게임리프트와 럼버야드)
 
Improving MySQL performance with Hadoop
Improving MySQL performance with HadoopImproving MySQL performance with Hadoop
Improving MySQL performance with Hadoop
 
Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강
Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강
Big data infra core technology 빅데이터 전문인력-양성사업_분석과정-특강
 
General Additive Models in R
General Additive Models in RGeneral Additive Models in R
General Additive Models in R
 
개발자 혼자서 RPG 게임 만들기
개발자 혼자서 RPG 게임 만들기개발자 혼자서 RPG 게임 만들기
개발자 혼자서 RPG 게임 만들기
 
개발자를 위한 R로 wordcloud 10분만에 만들기
개발자를 위한 R로 wordcloud 10분만에 만들기개발자를 위한 R로 wordcloud 10분만에 만들기
개발자를 위한 R로 wordcloud 10분만에 만들기
 
아마존의 관리형 게임 플랫폼 활용하기: GameLift (Deep Dive) :: 구승모 솔루션즈 아키텍트 :: Gaming on AWS ...
아마존의 관리형 게임 플랫폼 활용하기: GameLift (Deep Dive) :: 구승모 솔루션즈 아키텍트 :: Gaming on AWS ...아마존의 관리형 게임 플랫폼 활용하기: GameLift (Deep Dive) :: 구승모 솔루션즈 아키텍트 :: Gaming on AWS ...
아마존의 관리형 게임 플랫폼 활용하기: GameLift (Deep Dive) :: 구승모 솔루션즈 아키텍트 :: Gaming on AWS ...
 
OSGeo와 Open Data
OSGeo와 Open DataOSGeo와 Open Data
OSGeo와 Open Data
 
황성수 공공데이터 개방과 공공이슈 해결
황성수 공공데이터 개방과 공공이슈 해결황성수 공공데이터 개방과 공공이슈 해결
황성수 공공데이터 개방과 공공이슈 해결
 
Distributed R: The Next Generation Platform for Predictive Analytics
Distributed R: The Next Generation Platform for Predictive AnalyticsDistributed R: The Next Generation Platform for Predictive Analytics
Distributed R: The Next Generation Platform for Predictive Analytics
 
Deciphering voice of customer through speech analytics
Deciphering voice of customer through speech analyticsDeciphering voice of customer through speech analytics
Deciphering voice of customer through speech analytics
 
Optimizing Facebook Campaigns with R
Optimizing Facebook Campaigns with ROptimizing Facebook Campaigns with R
Optimizing Facebook Campaigns with R
 
Cloud Conf 2015 - Develop and Deploy IOT Applications
Cloud Conf 2015 - Develop and Deploy IOT ApplicationsCloud Conf 2015 - Develop and Deploy IOT Applications
Cloud Conf 2015 - Develop and Deploy IOT Applications
 
R lecture oga
R lecture ogaR lecture oga
R lecture oga
 

데이터 분석의 길 1. “고수는 생선 잡는 법을 알고있다” (검색과 영어)

  • 1. Mar 2015 권재명 데이터 분석의 길 1. “고수는 생선 잡는 법을 알고있다” (검색과 영어)
  • 2. “생선을 주면 하루 먹거리가 해결되지만, 생선 잡는 법을 가르치면 평생 먹고살수있다 (give a man a fish and you feed him for a day; teach a man to fish and you feed him for a lifetime)”—속담
  • 3. 문제 설정 R에서 자료를 읽어들였는데 시간컬럼이 표준시간대(UTC) 였다. 그 자료를 태평양 시간대로 바꿔서 출력하고 싶다.
  • 4. 1. 국내 검색엔진에서 “r에서 시간대 변환”을 검색한다. 2. 도움이 되는 검색 결과가 보이지 않는다.* 3. 영어 표현을 알아낸다. “r convert time zone”. 4. 국내 검색엔진에서 “r convert time zone”을 검색한다. 5. 아직도 큰 도움이 되지 않는다.* 6. ... (어떻게 하나?) * 화면캡춰 생략 문제해결 노력 (우리나라의 경우)
  • 5. 1. “How do I convert time zone in R? Let’s Google it by typing ‘r convert time zone’” 2. 일부를 입력했을때 자동완성 (autocomplete)을 통해 이미 많은 분석가들이 같은 내용을 질문한 것을 알 수 있다. 더불어 유사한 검색 문구들도 쓸모가 있는 내용들이다. 3. 결과는 쪽집게. (다음 페이지) 문제해결 노력 (영어권 엔지니어들의 경우)
  • 6. 첫번째 검색 결과에 이미 쓸만한 답이 나와 있다. 다 른 결과들도 도움이 되는 내용들이다. 상황 종료. 정답은: 문제해결 노력 (영어권 엔지니어들의 경우)
  • 7. 영어 콘텐츠. 검색. 데이터분석가 중 많은 사람들이 전혀 책을 통해 R을 배우지 않았다. 질문이 있을때마다 구글로 찾아나가는 것. 데이터 분석의 디테일에 대한 질의-응답 자료는 영어 컨텐츠가 한국말 컨텐츠에 비해 비교할 수 없을 정도로 풍부하다. 영어권 엔지니어가 압도적으로 많은 때문이다. 그리고 영어 컨텐츠를 가장 잘 잡아주는 검색엔진은 현재로는 구글이다.
  • 8. 다른 검색엔진은? 같은 검색을 Microsoft의 bing 에서 실행해 보았다. 자동완성도, 검색 결과도, 아주 만족스럽지는 않다. 하나의 예에 불과하지만, 구글이 사용자들의 이용데 이터를 서비스개선에 사용하는 선순환에 기반하여 타 검색회사들이 따라가기 어려울 정도로 앞서있는 것을 반영한다.
  • 9. 고수가 되려면 필요한 것을 스스로 검색하고, 배워나갈 능력이 있어야 한다. 그 능력의 핵심은 “영어”와 “검색”이다. 그러므로 기술적인 내용들은 영어검색을 생활화하는 것이 고수가 되는 훈련이 된다. 앞으로 질문이 있다면, 일단은 영어로 구글검색! “고수는 생선 잡는 법을 알고있다”
  • 10. 따름정리: 구글하면 나오는 내용은 적을 필요가 없다 그러므로 앞으로의 슬라이드에서도 구글검색하면 나올 내용은 가급적 피하려고 한다. (그럼 뭘 쓸건데? -_-; )
  • 11. 연습문제: 그렇다면 R에서 사용할 수 있는 모든 타임존을 나열하려면 어떻게 하 면 될까? 연습문제
  • 13. 영어 검색 키워드를 찾기 위해 구글번역(translate.google.com)을 사용할 수 있다. 이렇게: 그리고 나서 번역된 영문 키워드를 사용해 검색하면 된다. 물론 검색 결과는 또다시 영어문서 -_-; (기계번역이 일반화되기를 기다리며) 영어에 자신이 없다면?
  • 14. 기타 사이 트들 기술적인 질문에 대한 답들은 다음 두 사이 트에 편중된다. 1. 스택 오버플로우(Stack Overflow)와 그 일당들. 특히 크로스 밸리데이티드 (Cross Validated) 2. 위키피디아 (Wikipedia) 영어권 기술 컨텐츠 구글 Stack Overflow Wikipedia 기타 사이 트들 기타 사이 트들 엔지니어 이런 형국... 검색