2. 데이터 분석가의 숫자유감
데이터와 관련된 업무를 수행할 때
무엇에 주의해야 하나?
• 멋진 BI 도구만 있으면 통찰력을 얻을 수 있을까?
• 데이터만 많이 모으면 저절로 분석이 이뤄질까?
• 실험을 위해 데이터를 모으고 분석하는 과정에서 어떤 점에 주의해야할까?
• 데이터 분석가가 되기 위해서는 어떤 통계 지식이 필요할까?
• 불확실한 상황에서 확신을 얻으려면 무엇을 해야할까?
3. 데이터 분석가의 숫자유감
이 책의 목차
대규모 시스템을 만들기 위해서는 무엇을 생각해야 할까?
• 1화. 상관관계와 인과관계
• ____광고 덕분에 DAU가 늘었다?
• 2화. 숫자의 불확실성
• ____큰 수를 더 크다고 말하지 못하고
• 3화. 모수와 표본
• ____모수가 이렇게 충분한데 그냥 쓰면 안 될까?
• 4화. 확률과 분포
• ____그때는 맞고 지금은 틀린가?
• 5화. 실험을 통한 의사 결정
• ____실험의, 실험에 의한, 실험을 위한
• 6화. 그래프 읽기
• ____백문이 불여일견이라는 거짓말
• 7화. 추세선 그리기
• ____엑셀이 이르시되 추세선이 있으라
• 8화. 시계열 데이터
• ____나는 내일, 어제의 데이터와 만난다
• 9화. 별점의 함정
• ____나의 3점과 당신의 3점은 다르다
• 10화. 인구통계학 정보의 효용성
• ____이 광고는 30대의 여성을 대상으로 타기팅했습니다?
• 11화. 조건부 확률
• ____그 식당이 맛집일 확률을 찾아서
• 12화. 범위 제한을 통한 정확도 향상
• ____늘 옳은 말만 하는 법
• 13화. 평균이란 무엇인가?
• ____평균 연봉의 함정 281
• 14화. 데이터 문해력
• ____데이터로 읽고 쓰기
4. 데이터 분석가의 숫자유감
무엇이 이 책을 흥미롭게 만드는가?(1)
복잡한 이론 대신 알기 쉬운 사례를 중심으로 설명한다
• 14개 화마다 각각 현업에서 일어나는 상황을 중심으로 필요한 개념을 설명하는 방식으로 되어 있다
• 저지르기 쉬운 실수를 보여주고, 이와 관련된 개념을 설명한 다음에 어떻게 접근해야 할지 해법을 제시하는 방식으로 스토리를 전개
한다.
• 이론적인 설명은 최소로 줄이고 말로 풀어가므로 수학 공식만 보면 도망가고 싶은 분들께 적합하다
• 기초적인 통계에 대한 내용을 데이터 분석가 관점에서 다루고 있으므로 실용적인 측면이 강하다
• 엑셀에 대한 일부 설명을 제외하고는 도구에 중립적인 특성이 있다
• 또한 엔지니어링 입장에서 다루는 내용이 아니므로 당연하지만 프로그래밍 언어나 프레임워크에 대한 설명도 없다
6. 데이터 분석가의 숫자유감
대상 독자
데이터 과학에 대해 관심이 있는 사람들
• 데이터 과학자가 되고 싶지만, 아직 데이터 과학자가 무슨 일을 하는지 모르는 취업 준비생
• 데이터 과학에서 사용되는 필수적인 통계 개념을 빠르게 익히고 싶은 수학/통계 비전공자
• 조금 더 분석 쪽으로 접근하고 싶은 초급 데이터 엔지니어
• 데이터 중심으로 업무를 진행하는 조직의 마케터와 기획자
• 그리고 언론이, 보고서나, 인터넷에 오르내리는 각종 통계와 예측 자료를 제대로 이해하고 싶은 일반 독자
7. 데이터 분석가의 숫자유감
결론
데이터 과학자로서 기본 소양을 쌓아보자
• 실전 매뉴얼은 아니지만, 기본 소양을 쌓기 위한 기초서라는 사실을 알고 가벼운 마음으로 읽어보자
(그래서 만화다)
• 통계 개념보다는 에피소드 중심으로 내용이 전개되다 보니 “만화로 풀어낼 필요가 있을까?”하
는 장면도 종종 눈에 띄긴 하지만… 독자들의 재미를 위해서 넣었다고 생각한다
• 만화 뒤에 이어지는 설명도 빼놓지 않고 읽어보면 의도가 더 잘 파악될 것이다
• 본격적으로 통계를 만화로 배우고 싶다면 <세상에서 가장 재미있는 통계학>을 강력하게 추천한다
• 이 책은 만화라는 매체를 극한으로 활용해 따분하고 지루하고 재미없는 통계에 대한 인식을 바
꿀 만한 파괴력이 있다 → 조건부 확률, 베이즈 정리, 잘못된 양성 반응에 대한 설명은 예술이다!
• 서평: https://jhrogue.blogspot.com/2019/12/blog-post.html
• 책을 보내주신 골든래빗 출판사 대표님께 감사 말씀 전합니다.
8. 발표자 소개
기술 배경
전문 검색 엔진, 임베디드 시스템(리눅스 커널 디바이스 드라이버), 빅데이터/인공지능 연구 개발,
고성능 고가용성 데이터베이스
주요활동
IT 전문서 번역 (클린 코드, 피플웨어, 해커: 광기의 랩소디, 게임 엔진 블랙 북 등)
개발강의 (삼성전자, SK C&C, 삼성SDC, 현대자동차 기술 세미나와 교육)
활동채널
블로그: https://jhrogue.blogspot.com
슬라이드 셰어: https://www.slideshare.net/jrogue/presentations
유튜브: https://www.youtube.com/c/박재호dev
문의 jrogue@gmail.com
박재호