SlideShare uma empresa Scribd logo
1 de 8
Baixar para ler offline
데이터 분석가의 숫자유감
데이터 분석가의 숫자유감
데이터와 관련된 업무를 수행할 때
무엇에 주의해야 하나?
• 멋진 BI 도구만 있으면 통찰력을 얻을 수 있을까?
• 데이터만 많이 모으면 저절로 분석이 이뤄질까?
• 실험을 위해 데이터를 모으고 분석하는 과정에서 어떤 점에 주의해야할까?
• 데이터 분석가가 되기 위해서는 어떤 통계 지식이 필요할까?
• 불확실한 상황에서 확신을 얻으려면 무엇을 해야할까?
데이터 분석가의 숫자유감
이 책의 목차
대규모 시스템을 만들기 위해서는 무엇을 생각해야 할까?
• 1화. 상관관계와 인과관계
• ____광고 덕분에 DAU가 늘었다?
• 2화. 숫자의 불확실성
• ____큰 수를 더 크다고 말하지 못하고
• 3화. 모수와 표본
• ____모수가 이렇게 충분한데 그냥 쓰면 안 될까?
• 4화. 확률과 분포
• ____그때는 맞고 지금은 틀린가?
• 5화. 실험을 통한 의사 결정
• ____실험의, 실험에 의한, 실험을 위한
• 6화. 그래프 읽기
• ____백문이 불여일견이라는 거짓말
• 7화. 추세선 그리기
• ____엑셀이 이르시되 추세선이 있으라
• 8화. 시계열 데이터
• ____나는 내일, 어제의 데이터와 만난다
• 9화. 별점의 함정
• ____나의 3점과 당신의 3점은 다르다
• 10화. 인구통계학 정보의 효용성
• ____이 광고는 30대의 여성을 대상으로 타기팅했습니다?
• 11화. 조건부 확률
• ____그 식당이 맛집일 확률을 찾아서
• 12화. 범위 제한을 통한 정확도 향상
• ____늘 옳은 말만 하는 법
• 13화. 평균이란 무엇인가?
• ____평균 연봉의 함정 281
• 14화. 데이터 문해력
• ____데이터로 읽고 쓰기
데이터 분석가의 숫자유감
무엇이 이 책을 흥미롭게 만드는가?(1)
복잡한 이론 대신 알기 쉬운 사례를 중심으로 설명한다
• 14개 화마다 각각 현업에서 일어나는 상황을 중심으로 필요한 개념을 설명하는 방식으로 되어 있다
• 저지르기 쉬운 실수를 보여주고, 이와 관련된 개념을 설명한 다음에 어떻게 접근해야 할지 해법을 제시하는 방식으로 스토리를 전개
한다.
• 이론적인 설명은 최소로 줄이고 말로 풀어가므로 수학 공식만 보면 도망가고 싶은 분들께 적합하다
• 기초적인 통계에 대한 내용을 데이터 분석가 관점에서 다루고 있으므로 실용적인 측면이 강하다
• 엑셀에 대한 일부 설명을 제외하고는 도구에 중립적인 특성이 있다
• 또한 엔지니어링 입장에서 다루는 내용이 아니므로 당연하지만 프로그래밍 언어나 프레임워크에 대한 설명도 없다
데이터 분석가의 숫자유감
무엇이 이 책을 흥미롭게 만드는가?(2)
만화로 개념을 풀어서 설명한다
데이터 분석가의 숫자유감
대상 독자
데이터 과학에 대해 관심이 있는 사람들
• 데이터 과학자가 되고 싶지만, 아직 데이터 과학자가 무슨 일을 하는지 모르는 취업 준비생
• 데이터 과학에서 사용되는 필수적인 통계 개념을 빠르게 익히고 싶은 수학/통계 비전공자
• 조금 더 분석 쪽으로 접근하고 싶은 초급 데이터 엔지니어
• 데이터 중심으로 업무를 진행하는 조직의 마케터와 기획자
• 그리고 언론이, 보고서나, 인터넷에 오르내리는 각종 통계와 예측 자료를 제대로 이해하고 싶은 일반 독자
데이터 분석가의 숫자유감
결론
데이터 과학자로서 기본 소양을 쌓아보자
• 실전 매뉴얼은 아니지만, 기본 소양을 쌓기 위한 기초서라는 사실을 알고 가벼운 마음으로 읽어보자
(그래서 만화다)
• 통계 개념보다는 에피소드 중심으로 내용이 전개되다 보니 “만화로 풀어낼 필요가 있을까?”하
는 장면도 종종 눈에 띄긴 하지만… 독자들의 재미를 위해서 넣었다고 생각한다
• 만화 뒤에 이어지는 설명도 빼놓지 않고 읽어보면 의도가 더 잘 파악될 것이다
• 본격적으로 통계를 만화로 배우고 싶다면 <세상에서 가장 재미있는 통계학>을 강력하게 추천한다
• 이 책은 만화라는 매체를 극한으로 활용해 따분하고 지루하고 재미없는 통계에 대한 인식을 바
꿀 만한 파괴력이 있다 → 조건부 확률, 베이즈 정리, 잘못된 양성 반응에 대한 설명은 예술이다!
• 서평: https://jhrogue.blogspot.com/2019/12/blog-post.html
• 책을 보내주신 골든래빗 출판사 대표님께 감사 말씀 전합니다.
발표자 소개
기술 배경
전문 검색 엔진, 임베디드 시스템(리눅스 커널 디바이스 드라이버), 빅데이터/인공지능 연구 개발,
고성능 고가용성 데이터베이스
주요활동
IT 전문서 번역 (클린 코드, 피플웨어, 해커: 광기의 랩소디, 게임 엔진 블랙 북 등)
개발강의 (삼성전자, SK C&C, 삼성SDC, 현대자동차 기술 세미나와 교육)
활동채널
블로그: https://jhrogue.blogspot.com
슬라이드 셰어: https://www.slideshare.net/jrogue/presentations
유튜브: https://www.youtube.com/c/박재호dev
문의 jrogue@gmail.com
박재호

Mais conteúdo relacionado

Semelhante a (책 소개) 데이터 분석가의 숫자유감

Semelhante a (책 소개) 데이터 분석가의 숫자유감 (20)

데이터를 비즈니스에 활용하기 왜 어려울까?
데이터를 비즈니스에 활용하기 왜 어려울까?데이터를 비즈니스에 활용하기 왜 어려울까?
데이터를 비즈니스에 활용하기 왜 어려울까?
 
데이터를 얻으려는 노오오력
데이터를 얻으려는 노오오력데이터를 얻으려는 노오오력
데이터를 얻으려는 노오오력
 
How to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its DifficultyHow to Create Value from Data, and Its Difficulty
How to Create Value from Data, and Its Difficulty
 
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
데이터 사이언티스트를 꿈꾸는 분들을 위한 개인적인 데이터 사이언스 경험과 소회 - what I experienced as a data sc...
 
헬로 데이터 과학: 삶과 업무를 개선하는 데이터 과학 이야기 (스타트업 얼라이언스 강연)
헬로 데이터 과학: 삶과 업무를 개선하는 데이터 과학 이야기 (스타트업 얼라이언스 강연)헬로 데이터 과학: 삶과 업무를 개선하는 데이터 과학 이야기 (스타트업 얼라이언스 강연)
헬로 데이터 과학: 삶과 업무를 개선하는 데이터 과학 이야기 (스타트업 얼라이언스 강연)
 
[PAP] 팝콘 시즌 1 컨퍼런스 사전 QnA
[PAP] 팝콘 시즌 1 컨퍼런스 사전 QnA[PAP] 팝콘 시즌 1 컨퍼런스 사전 QnA
[PAP] 팝콘 시즌 1 컨퍼런스 사전 QnA
 
데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립데이터가 흐르는 조직 만들기 - 마이리얼트립
데이터가 흐르는 조직 만들기 - 마이리얼트립
 
(독서광) 책 vs 책: 정형 vs 비정형 딥러닝
(독서광) 책 vs 책: 정형 vs 비정형 딥러닝(독서광) 책 vs 책: 정형 vs 비정형 딥러닝
(독서광) 책 vs 책: 정형 vs 비정형 딥러닝
 
Learning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonseiLearning dataanalyst 2020oct_yonsei
Learning dataanalyst 2020oct_yonsei
 
2011~2012 소프트웨어 관련도서 추천 리뷰 모음
2011~2012 소프트웨어 관련도서 추천 리뷰 모음2011~2012 소프트웨어 관련도서 추천 리뷰 모음
2011~2012 소프트웨어 관련도서 추천 리뷰 모음
 
『프로젝트 성패를 결정짓는 데이터 모델링 이야기』 - 미리보기
『프로젝트 성패를 결정짓는 데이터 모델링 이야기』 - 미리보기『프로젝트 성패를 결정짓는 데이터 모델링 이야기』 - 미리보기
『프로젝트 성패를 결정짓는 데이터 모델링 이야기』 - 미리보기
 
프로그래머로 사는법
프로그래머로 사는법프로그래머로 사는법
프로그래머로 사는법
 
Week1 ot
Week1 otWeek1 ot
Week1 ot
 
Data driven design 소화하기
Data driven design 소화하기Data driven design 소화하기
Data driven design 소화하기
 
[울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례
[울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례[울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례
[울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례
 
Peopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start todayPeopleplus hr session(2) people analytics, start today
Peopleplus hr session(2) people analytics, start today
 
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
[NDC 2011] 게임 개발자를 위한 데이터분석의 도입
 
여기컨_스타트업 기획자의 월화수목금_이수지
여기컨_스타트업 기획자의 월화수목금_이수지여기컨_스타트업 기획자의 월화수목금_이수지
여기컨_스타트업 기획자의 월화수목금_이수지
 
나의 8년 (2012~2019)
나의 8년 (2012~2019)나의 8년 (2012~2019)
나의 8년 (2012~2019)
 
[팝콘 시즌1] 윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들
[팝콘 시즌1] 윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들[팝콘 시즌1] 윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들
[팝콘 시즌1] 윤석진 : 조직의 데이터 드리븐 문화를 위해 극복해야하는 문제들
 

Mais de Jay Park

Mais de Jay Park (20)

(독서광) 인간이 초대한 대형 참사 - 대형 참사가 일어날 때까지 사람들은 무엇을 하고 있었는가?
(독서광) 인간이 초대한 대형 참사 - 대형 참사가 일어날 때까지 사람들은 무엇을 하고 있었는가?(독서광) 인간이 초대한 대형 참사 - 대형 참사가 일어날 때까지 사람들은 무엇을 하고 있었는가?
(독서광) 인간이 초대한 대형 참사 - 대형 참사가 일어날 때까지 사람들은 무엇을 하고 있었는가?
 
(독서광) 쉽고 빠르게 익히는 실전 LLM - ChatGPT 활용부터 LLM 파인튜닝, 임베딩, 고급 프롬프트 엔지니어링까지
(독서광) 쉽고 빠르게 익히는 실전 LLM - ChatGPT 활용부터 LLM 파인튜닝, 임베딩, 고급 프롬프트 엔지니어링까지(독서광) 쉽고 빠르게 익히는 실전 LLM - ChatGPT 활용부터 LLM 파인튜닝, 임베딩, 고급 프롬프트 엔지니어링까지
(독서광) 쉽고 빠르게 익히는 실전 LLM - ChatGPT 활용부터 LLM 파인튜닝, 임베딩, 고급 프롬프트 엔지니어링까지
 
(독서광) LEAN HR - 당신의 스타트업은 안녕하십니까 (한빛미디어 2024)
(독서광) LEAN HR - 당신의 스타트업은 안녕하십니까 (한빛미디어 2024)(독서광) LEAN HR - 당신의 스타트업은 안녕하십니까 (한빛미디어 2024)
(독서광) LEAN HR - 당신의 스타트업은 안녕하십니까 (한빛미디어 2024)
 
(독서광) 구술 문화와 문자 문화: 출간 30주년 기념판 (전후 해제 포함)
(독서광) 구술 문화와 문자 문화: 출간 30주년 기념판 (전후 해제 포함)(독서광) 구술 문화와 문자 문화: 출간 30주년 기념판 (전후 해제 포함)
(독서광) 구술 문화와 문자 문화: 출간 30주년 기념판 (전후 해제 포함)
 
(독서광) 테드 창의 숨 (아홉 가지 단편/중편 SF 과학 소설 모음집)
(독서광) 테드 창의 숨 (아홉 가지 단편/중편 SF 과학 소설 모음집)(독서광) 테드 창의 숨 (아홉 가지 단편/중편 SF 과학 소설 모음집)
(독서광) 테드 창의 숨 (아홉 가지 단편/중편 SF 과학 소설 모음집)
 
(독서광) 이제는 이기는 인생을 살고 싶다 - 적을 만들지 않고 단번에 갈등을 풀어내는 백전백승 변호사의 지혜지략
(독서광) 이제는 이기는 인생을 살고 싶다 - 적을 만들지 않고 단번에 갈등을 풀어내는 백전백승 변호사의 지혜지략(독서광) 이제는 이기는 인생을 살고 싶다 - 적을 만들지 않고 단번에 갈등을 풀어내는 백전백승 변호사의 지혜지략
(독서광) 이제는 이기는 인생을 살고 싶다 - 적을 만들지 않고 단번에 갈등을 풀어내는 백전백승 변호사의 지혜지략
 
(독서광) 프로덕트 매니저 원칙: 10년이 가도 변하지 않을 PM/PO로 살아가는 원칙과 철학
(독서광) 프로덕트 매니저 원칙: 10년이 가도 변하지 않을 PM/PO로 살아가는 원칙과 철학(독서광) 프로덕트 매니저 원칙: 10년이 가도 변하지 않을 PM/PO로 살아가는 원칙과 철학
(독서광) 프로덕트 매니저 원칙: 10년이 가도 변하지 않을 PM/PO로 살아가는 원칙과 철학
 
(독서광) 개발자로 첫 출근했어요 - 사내 개발 도구, 기술, 문화 적응 가이드
(독서광) 개발자로 첫 출근했어요 - 사내 개발 도구, 기술, 문화 적응 가이드(독서광) 개발자로 첫 출근했어요 - 사내 개발 도구, 기술, 문화 적응 가이드
(독서광) 개발자로 첫 출근했어요 - 사내 개발 도구, 기술, 문화 적응 가이드
 
(독서광) 책 vs 책: 코딩 테스트 합격자 되기 vs 파이썬 알고리즘 인터뷰
(독서광) 책 vs 책: 코딩 테스트 합격자 되기 vs 파이썬 알고리즘 인터뷰(독서광) 책 vs 책: 코딩 테스트 합격자 되기 vs 파이썬 알고리즘 인터뷰
(독서광) 책 vs 책: 코딩 테스트 합격자 되기 vs 파이썬 알고리즘 인터뷰
 
(독서광) 테니스 이너 게임
(독서광) 테니스 이너 게임(독서광) 테니스 이너 게임
(독서광) 테니스 이너 게임
 
(독서광) 인간 vs. AI 정규표현식 문제 풀이 대결
(독서광) 인간 vs. AI 정규표현식 문제 풀이 대결(독서광) 인간 vs. AI 정규표현식 문제 풀이 대결
(독서광) 인간 vs. AI 정규표현식 문제 풀이 대결
 
(독서광) 모던 리눅스 교과서
(독서광) 모던 리눅스 교과서(독서광) 모던 리눅스 교과서
(독서광) 모던 리눅스 교과서
 
(독서광) 상자 밖에 있는 사람
(독서광) 상자 밖에 있는 사람(독서광) 상자 밖에 있는 사람
(독서광) 상자 밖에 있는 사람
 
(독서광) 자바 알고리즘 인터뷰 with 코틀린
(독서광) 자바 알고리즘 인터뷰 with 코틀린(독서광) 자바 알고리즘 인터뷰 with 코틀린
(독서광) 자바 알고리즘 인터뷰 with 코틀린
 
(독서광) 리그 오브 레전드 플레이어 중심주의
(독서광) 리그 오브 레전드 플레이어 중심주의(독서광) 리그 오브 레전드 플레이어 중심주의
(독서광) 리그 오브 레전드 플레이어 중심주의
 
(일상다반사) 2023년 구독자 3,000명 돌파 이벤트
(일상다반사) 2023년 구독자 3,000명 돌파 이벤트(일상다반사) 2023년 구독자 3,000명 돌파 이벤트
(일상다반사) 2023년 구독자 3,000명 돌파 이벤트
 
(독서광) 오늘날 우리는 컴퓨터라 부른다
(독서광) 오늘날 우리는 컴퓨터라 부른다(독서광) 오늘날 우리는 컴퓨터라 부른다
(독서광) 오늘날 우리는 컴퓨터라 부른다
 
(독서광) 사실은 이것도 디자인입니다
(독서광) 사실은 이것도 디자인입니다(독서광) 사실은 이것도 디자인입니다
(독서광) 사실은 이것도 디자인입니다
 
(독서광) 프로덕트 매니지먼트
(독서광) 프로덕트 매니지먼트(독서광) 프로덕트 매니지먼트
(독서광) 프로덕트 매니지먼트
 
(독서광) 슬기로운 파이썬 트릭
(독서광) 슬기로운 파이썬 트릭(독서광) 슬기로운 파이썬 트릭
(독서광) 슬기로운 파이썬 트릭
 

(책 소개) 데이터 분석가의 숫자유감

  • 2. 데이터 분석가의 숫자유감 데이터와 관련된 업무를 수행할 때 무엇에 주의해야 하나? • 멋진 BI 도구만 있으면 통찰력을 얻을 수 있을까? • 데이터만 많이 모으면 저절로 분석이 이뤄질까? • 실험을 위해 데이터를 모으고 분석하는 과정에서 어떤 점에 주의해야할까? • 데이터 분석가가 되기 위해서는 어떤 통계 지식이 필요할까? • 불확실한 상황에서 확신을 얻으려면 무엇을 해야할까?
  • 3. 데이터 분석가의 숫자유감 이 책의 목차 대규모 시스템을 만들기 위해서는 무엇을 생각해야 할까? • 1화. 상관관계와 인과관계 • ____광고 덕분에 DAU가 늘었다? • 2화. 숫자의 불확실성 • ____큰 수를 더 크다고 말하지 못하고 • 3화. 모수와 표본 • ____모수가 이렇게 충분한데 그냥 쓰면 안 될까? • 4화. 확률과 분포 • ____그때는 맞고 지금은 틀린가? • 5화. 실험을 통한 의사 결정 • ____실험의, 실험에 의한, 실험을 위한 • 6화. 그래프 읽기 • ____백문이 불여일견이라는 거짓말 • 7화. 추세선 그리기 • ____엑셀이 이르시되 추세선이 있으라 • 8화. 시계열 데이터 • ____나는 내일, 어제의 데이터와 만난다 • 9화. 별점의 함정 • ____나의 3점과 당신의 3점은 다르다 • 10화. 인구통계학 정보의 효용성 • ____이 광고는 30대의 여성을 대상으로 타기팅했습니다? • 11화. 조건부 확률 • ____그 식당이 맛집일 확률을 찾아서 • 12화. 범위 제한을 통한 정확도 향상 • ____늘 옳은 말만 하는 법 • 13화. 평균이란 무엇인가? • ____평균 연봉의 함정 281 • 14화. 데이터 문해력 • ____데이터로 읽고 쓰기
  • 4. 데이터 분석가의 숫자유감 무엇이 이 책을 흥미롭게 만드는가?(1) 복잡한 이론 대신 알기 쉬운 사례를 중심으로 설명한다 • 14개 화마다 각각 현업에서 일어나는 상황을 중심으로 필요한 개념을 설명하는 방식으로 되어 있다 • 저지르기 쉬운 실수를 보여주고, 이와 관련된 개념을 설명한 다음에 어떻게 접근해야 할지 해법을 제시하는 방식으로 스토리를 전개 한다. • 이론적인 설명은 최소로 줄이고 말로 풀어가므로 수학 공식만 보면 도망가고 싶은 분들께 적합하다 • 기초적인 통계에 대한 내용을 데이터 분석가 관점에서 다루고 있으므로 실용적인 측면이 강하다 • 엑셀에 대한 일부 설명을 제외하고는 도구에 중립적인 특성이 있다 • 또한 엔지니어링 입장에서 다루는 내용이 아니므로 당연하지만 프로그래밍 언어나 프레임워크에 대한 설명도 없다
  • 5. 데이터 분석가의 숫자유감 무엇이 이 책을 흥미롭게 만드는가?(2) 만화로 개념을 풀어서 설명한다
  • 6. 데이터 분석가의 숫자유감 대상 독자 데이터 과학에 대해 관심이 있는 사람들 • 데이터 과학자가 되고 싶지만, 아직 데이터 과학자가 무슨 일을 하는지 모르는 취업 준비생 • 데이터 과학에서 사용되는 필수적인 통계 개념을 빠르게 익히고 싶은 수학/통계 비전공자 • 조금 더 분석 쪽으로 접근하고 싶은 초급 데이터 엔지니어 • 데이터 중심으로 업무를 진행하는 조직의 마케터와 기획자 • 그리고 언론이, 보고서나, 인터넷에 오르내리는 각종 통계와 예측 자료를 제대로 이해하고 싶은 일반 독자
  • 7. 데이터 분석가의 숫자유감 결론 데이터 과학자로서 기본 소양을 쌓아보자 • 실전 매뉴얼은 아니지만, 기본 소양을 쌓기 위한 기초서라는 사실을 알고 가벼운 마음으로 읽어보자 (그래서 만화다) • 통계 개념보다는 에피소드 중심으로 내용이 전개되다 보니 “만화로 풀어낼 필요가 있을까?”하 는 장면도 종종 눈에 띄긴 하지만… 독자들의 재미를 위해서 넣었다고 생각한다 • 만화 뒤에 이어지는 설명도 빼놓지 않고 읽어보면 의도가 더 잘 파악될 것이다 • 본격적으로 통계를 만화로 배우고 싶다면 <세상에서 가장 재미있는 통계학>을 강력하게 추천한다 • 이 책은 만화라는 매체를 극한으로 활용해 따분하고 지루하고 재미없는 통계에 대한 인식을 바 꿀 만한 파괴력이 있다 → 조건부 확률, 베이즈 정리, 잘못된 양성 반응에 대한 설명은 예술이다! • 서평: https://jhrogue.blogspot.com/2019/12/blog-post.html • 책을 보내주신 골든래빗 출판사 대표님께 감사 말씀 전합니다.
  • 8. 발표자 소개 기술 배경 전문 검색 엔진, 임베디드 시스템(리눅스 커널 디바이스 드라이버), 빅데이터/인공지능 연구 개발, 고성능 고가용성 데이터베이스 주요활동 IT 전문서 번역 (클린 코드, 피플웨어, 해커: 광기의 랩소디, 게임 엔진 블랙 북 등) 개발강의 (삼성전자, SK C&C, 삼성SDC, 현대자동차 기술 세미나와 교육) 활동채널 블로그: https://jhrogue.blogspot.com 슬라이드 셰어: https://www.slideshare.net/jrogue/presentations 유튜브: https://www.youtube.com/c/박재호dev 문의 jrogue@gmail.com 박재호