1. 확률을 높이는 확률
- 직감과 현실을 차이를 일깨우는 확률적 사고
SW Kang
Feb/2015
이시우치 히로무 지음(2010년)
신현호 번역(2013년)
2. 불확실 한 세계를 살기 위한 확률적 사고
• 최선의 선택은 확률에 기반한 선택 ➔ 후회와 불안을 없애는 사고
• 잘못된 정보 해석에 빠지지 않기 위해서는
– 1) 출처, 2) 조사방법, 3)빠진 데이터, 4)바뀐 내용, 5) 상식기반 확인이 필수
– 도표와 숫자를 통해 진실을 확인
• 정보(확률)을 상황에 따라 왜곡된다.
– 시기와 장소, 선입견, 편의성, 자신의 이익에 따라 정보는 왜곡된다
• 지극히 정확한 대략적 추측 ➔ 나무가 아닌 숲을 보는 것 : 확률적 사고
– 추정의 목적과 구간을 명확히, 모델의 한계와 유용성에 주의
• ‘확률적으로 얼마만큼의 편의(bias)가 있는가?’에 살펴보고 의사결정 ➔ 피셔의 임의화 실험
• 가시화에 의한 확인
– 3 가지 가시화 방법 : 1) 수형도, 2) 도표, 3) 벤다이어그램
• 게임의 편향을 확인하면 게임에서 확률적으로 지지않을 방법을 찾을 수 있다
• 도박판을 경영하는 측은 ‘확률적 사고의 프로’ ➔ 모든 도박은 평균적으로 손해
노력은 어디까지나 도박이다. 그러니까 인생은 재미있다.
3. 목차
• ‘확률적 사고’로 무엇이 바뀌는가
• 이 세상의 정보는 거짓투성이? ‘직감’과 ‘현실’의 함정
• 무엇이 확률을 왜곡시키는가
• 모르면 모르는 대로 목표부터 설정하라
• 모르면 모르는 대로 흑백을 가려놓아라
• 의사결정을 위한 확률적 사고
• 게임과 도박에서 지지 않는 방법
• 일상에 감춰져 있는 확률
4. 확률적 사고로 무엇이 바뀌는가?
• 불확실성이 큰 상황에서의 행동은 ‘확률적 사고’에 근거 결과론, 결정론 등은 도움이 되지 않음
• 확률적 사고 : 모르는 부분과 모르는 가운데서도 아는 부분으로 상황을 정리하는 것
– 4할 타자 vs 2할 타자, 주사위 1,2,3,4 나올 가능성과 5,6이 나올 가능성
– 확률이 높은 쪽을 선택하는 것이 장기적으로 유리
– 세이버매트릭스(Sabermatrics) : 과학적 수치를 바탕으로 야구 시합에서 이기는 방법을 찾기 위한 기법
• 최고의 선택은 원인과 해결방법을 알 수 있는 경우, 최선의 선택은 확률에 기반한 선택
– 인생은 선택의 연속 ➔ 자유로운 선택을 할 수 있음을 감사하며 매순간 최선의 선택으로 풍요로운 삶 만들기
– 최선의 선택을 위해서
• 1) 확률로서 직감을 왜곡시키는 말에 민감, 2) 객관적 정보로 진실을 파악, 3)정확성과 부정확성 파악, 4)자신의 중요도에 따라 선택
• 후회와 불안을 줄이는 확률적 사고
– 후회를 없앤다 : 정리가 되어 있어 ‘이것이 최선이다’라는 신념으로 도전한 결과로서 실패는 후회가 없다
– 불안을 없앤다 : 불안은 근거가 없는 곳에서 생긴다.
– 농구 황제의 슛 성공률
5. [참고자료] 세이버 메트릭스
• 데이터 야구의 시대 – 세이버메트릭스
– SABR(The Society for American Baseball Research)+ merics
– SK 와이번스 김성근 감독의 훌륭한 전력분석팀
– 2011년 개봉한 <머니볼(Moneyball)>
• 월스트리트 경력의 저널리스트 Michael Lewis 작품
• Okland Athletics 의 Billy Beane 단장의 실화
• 출루율 기반의 선수 구성 : (출루율) = (안타+볼넷+데드볼)/(타수 – 희생번트)
– 타순 배치 시뮬레이션
• 잘치는 타자를 상위 타선에 ➔ 타석 기회가 많아짐
• 연타석 안타가 중요 ➔ 연속 안타는 득점을 높임
• 출루율 우선 타선 ➔ 팀의 득점력 향상 ( 출루율 > 정상 > 타율 > 반대 )
– 야구 통계는 ‘야구의 아버지’ Heny Chadwick의 박스 스코어 개념에서
– ‘세이버메트릭’의 아버지 : Bill James ➔ 빌제임스 야구 개요서
• OPS (On base Plus Slugging ) ➔ 출루율과 장타율의 합
– 2010년 LG 트윈스의 신연봉제도 ➔ ‘Valuation’의 도입
6. • 몬티홀의 딜레마 ➔ 직감적으로 모순되는 결과 (참고자료 참조)
– 인간의 직감은 속임을 당하기 쉽다
• 확률은 해석이 중요하다 ➔ 과장된/잘못된 해석 주의
– 폭력사건 대부분은 ‘잠’을 잔지 24시간 내에 발생
– 누구나 집에서 ‘빵’을 구워 먹었던 18세기 유럽의 평균 수명은 고작 50세
– 1) 출처, 2) 조사방법, 3)빠진 데이터, 4)바뀐 내용, 5) 상식기반 확인
• 마음의 회계학(Mental Accounting) : 돈을 다룰 경우의 심리 영향 연구하는 ‘행동 경제학’의 주요 개념
– 비싼 물건을 살 때는 약간의 가격 차이는 무시(4만원 구두를 2만원, 100만원 냉장고를 95만원에 파는 옆동네)
– 5000엔 할인 쿠폰을 받기 위해 1만엔 추가 지출
– 가전제품 살 경우 3년 무상 보증을 위한 5% 추가금 vs 5000원 점검 비용으로 3년간 무상 보증
– 학자금 적금 해약 vs 자동차 할부 의 가치 비교 (의미를 부여한 돈에 의한 판단 착오)
• 도표나 숫자를 확인함으로써 진실을 확인 ➔ 무지를 인식하고 알기위한 노력하는 확률적 사고
– 현실은 도표나 숫자로 정리하기가 쉽지는 않음 ➔ 최소한 어림잡아 계산은 해보아야
– 한 가지 사례로는 과학적 검증이 되지 않음
이 세상의 정보는 거짓투성이? 직감과 현실의 함정
▪ 범죄자 98%가 매일 먹는다
▪ 폭력사건 90%는 이 음식을 먹은 24시간 이내에 발생
▪신생아에게 이 음식을 주면 숨이 막힐 듯 괴로와 한다
▪이 음식을 먹고자란 아이의 약 과반수는 성적이 평균 이하
➔ 이 음식을 금지해야 할까?
선량한 시민 범죄자
매일 밥을 먹음 9704 (98%) 98 (98%)
가끔 밥을 안먹음 196 (2%) 2 (2%)
합 계 9900 100
8. • 시기와 장소를 바꾸면 내용도 달라진다 ➔ 정보의 편향(bias)성
– 정부에 대한 지지율은 설문 조사의 위치(지방, 도시, 강남, 강북)와 시간(낮시간, 밤시간)에 따라 변동
• 사람은 자신에게 득이 되는 정보를 주로 전달한다 ➔ 정보 전달자의 입장 확인 필요
– 상품에 불만인 99%를 제외한 만족한 1%를 소개
– ‘비디오 게임을 하는 아이는 바보가 되기쉽다’ ➔ 부모들의 이해득실에 따라 전파(TV, 방송, 그리고 소문)
• 선입견으로 생각이 바뀐다.
– 비싼 와인 vs 싼와인, 표고버섯 vs 송이버섯, A형 vs AB형
– 선입견이 자리를 잡으면 그와 일치하는 정보는 인지하기 쉽고, 기억하기 쉽고, 생각해내기 쉽다 ➔ 편견과
• 편의에 의해 생기는 도시전설
– ‘소니 타이머’ ➔ 신제품이 출시될 즈음에 고장이 나는 현상 : 화제성이 있어 기억하기 쉽고, 퍼지기 쉬움
– 도시 전설을 믿기 전에 우리 주변에 존재하는 편의를 감안해야
무엇이 확률을 왜곡시키는가
9. • 지극히 정확한 대략적 추측 ➔ 나무가 아닌 숲을 보는 것 : 확률적 사고
– 시카고의 조율사는 몇 명일까?
• (시카고 전체 인구) X (열심히 피아노 치는 사람 비율) X(1년 조율 횟수) X ( 1회 조율 비용) = (시카고 피아노 조율비용 합)
• (조율사 연 매출) X ( 조율사 수 ) = (시가코 피아노 조율 비용의 합)
• 위의 두 식을 대략적으로 계산하여 (대략적 추측)을 함
– 구글의 입사 시험
• 스쿨 버스에는 골프공이 몇개나 들어갈까? 전세계에는 얼마나 많은 피아노 조율사가 있을까? 등등
• 추정의 ‘목적’과 ‘구간’을 고려
– 위험부담을 최소화하기 위한 것이라면 가장 보수적인 결과를 고려해야
• 추정 모델의 한계와 유용성
– 모든 모델은 잘못되어 있다. 다만 사고를 전개해나가는 과정은 유용하다
모르면 모른는대로 목표부터 설정하라
10. • ‘확률적으로 얼마만큼의 편의(bias)가 있는가?’에 살펴보고 의사결정
– 한 경기의 심판은 몇 명이 필요한가? : (한심판이 실수할 확률)과 (유의수준)에 따라 달라짐
– 다수결은 인원이 많을수록 잘못이 줄어들기는 하지만, 미묘한 문제는 가급적 충분한 자료조사가 뒷받침되어야
– 귀무가설 과 대립가설에 따른 논제의 검증
• ’10%의 까마귀는 검지 않다’ 는 논제를 검증하기 위해서는 샘플 수집을 통해 검증 필요
• 귀무가설이 유의 범위 있는지 확인
– 과학은 ‘가장 겸허하게 객관적으로 논의하는 방법’
– 로널드 A. 피셔와 밀크티 검증 (참고자료 참조)
– 점쟁이에 대한 ‘임의화 실험’에 의한 검증 필요
모르면 모른는대로 흑백을 가려놓아라
11. [참고자료] 로널드 A. 피셔 – 현대 통계학의 아버지
• 실험 계획법 (The design of experiment) - 1935 년
• 우유가 먼저인가? 홍차가 먼저 인가?
– 우유를 먼저 넣은 밀크티와 홍차를 먼저 넣은 밀크티의 구분은 가능한가?
– 임의화 비교 실험에 의한 검증 제안
– 검증법에 대한 고민
▪ 한번 맞춘 경우 ➔ 50% 의 확률을 가짐
▪ 여러번 맞춘 경우 ➔ 특정 규칙에 따른 것은 아닌지 에 대한 확인 필요
▪ 한번의 실험의 경우 ➔ 특수 시간, 특수 여건에 의한 것인지 확인 필요
• Fisher의 3원칙
– 반복 실험 ( Repetition and Replication )
– 무작위화 ( Randomization )
– 국소 관리 ( Local Control )
• 2003년 영국왕립 화학 협회 - 한 잔의 완벽한 홍차를 타는 법
– 우유를 먼저 넣는 것이 뜨거운 홍차에 의한 우유 단백질의 변형(75도에서 발생)을 막는다.
12. • 가능성을 ‘가시화’ 해야
– 막연한 상황에 대한 이해와 다른 사람과 정확한 공유에 도움이 되는 ‘가시화’
– 불확실한 미래에 대해 회사의 경영적 판단과 개인의 미래에 대한 결정은 ‘가시화’를 기반으로
– 가시화는 목적이 아닌 수단 ➔ 무엇을 보고싶은 지가 명확해야 효과
• 가시화를 위한 세 가지 방법
– 수형도 : 조건에 따른 경우의 수를 그림으로 표현
– 도표: 중복에 따른 상황에 주의
(주사위의 2의 배수, 3의 배수 ➔ 2와 3의 배수는?)
– 벤다이어그램 : ‘중복의 경우를 쉽게 확인 가능
• ‘감’은 마지막까지 비축해두자
– 직감적으로 뭔가 이상한 느낌이 있는 경우는 확인 필요 ➔ 모델도 틀릴 수 있다
– 모델의 가정, 계산 방법에 대한 재확인 필요
의사 결정을 위한 확률적 사고
13. • 평균적으로 지지않는 방법
– 그리코 게임에서 지지않기 (가위 바위 보로 계단을 올라가는 게임)
• 상대방이 1:1:1로 가위 바위 보를 낸다는 가정 하에서 도표를 이용한 계산
• “가위를 많이 내고 바위를 적게”
• 확률의 편의(bias) 찾기
– 넘버스(numbers : 구매자가 직접 숫자를 기입하는 복권)의 당첨금 높이기
• 편향에 따른 확률 계산 ➔ 다른 사람이 많이 걸지 않는 숫자에 걸기
• 당첨자가 없을 경우에 이월되어 증가하는 상금에 도전
➔편향이 알려진 경우는 다른 사람들도 같은 행동을 하게 됨
➔다만, ‘어떤 확률에 주목해야할 지 관점을 전환하는 계기’ 로 삼아야
• 도박판을 경영하는 측은 ‘확률적 사고의 프로’ ➔ 모든 도박은 평균적으로 손해
– 이득을 보겠다는 생각보다는 아슬아슬한 체험을 감당할 수 있는 예산 범위에서 한다 는 자세로 임해야
게임과 도박에서 지지않는 방법
14. • 인간은 자유, 그 자체 - 장 폴 사르트르 (프랑스 철학자, 사상가)
– 생활습관병 ➔ 자신의 건강에 대해서도 자유의 영향이 더 큼. 기적의 건강식품은 없다
– 확률적으로 평소 생활습관이 엉망이면 병에 걸리 가능성이 높아짐
– 자신의 건강에 ‘불안’과 ‘후회’를 없애려면 확률적으로 건강한 생활 습관을 익혀야
• 생명보험 ➔ 기본적으로는 ‘손해’ (확률적으로)
– 보험회사는 ‘평균적으로 손해를 보지 않는’ 계약 내용으로 상품을 개발
– 협동조합, 공제조합 혹은 비영리단체의 보험은 광고나 근사한 옵션의 비용이 없어 확률적으로 손실이 적다
• 노력할 필요는 있는가?
– 제대로 된 목표를 정해 집중적으로 노력했을 때 도박보다 더 짜릿한 흥분을 느낀다
– “노력했다고 꼭 성공하는 것은 아니다. 하지만 성공한 사람은 언제나 노력하고 있다”
➔노력은 어디까지나 도박이다. 그러니까 인생은 재미있다.
일상에 감춰져 있는 확률