3. Теорема сложения вероятностей совместных событий
Теорема 1. Вероятность появления хотя бы одного из двух
совместных событий равна сумме вероятностей этих
событий без вероятности их произведения:
P( A B)
24.02.2014
P( A) P( B) P( A B)
3
4. Теорема сложения вероятностей совместных событий
Из теоремы получаем ряд следующих частных случаев:
1. Для независимых событий: P( A B) P( A) P( B) P( A) P( B)
2. Для зависимых событий: P( A B) P( A) P( B) P( A) PA ( B)
3. Для несовместных событий P(AB) 0
и в этом случае имеем подтверждение теоремы: P( A B) P( A) P( B)
Теорему сложения вероятностей можно обобщить на случай событий.
Следствие1.
n
n
P( Ai )
i1
24.02.2014
P( Ai )
i1
P( Ai A j )
1i jn
n1
P( Ai A j Ak ) ... ( 1) P( A1 A2 ... An ).
1i jk n
4
5. Пример.
В группе из 20 человек проводился экспресс-тест «Узнай свой характер». При определении
«ведущей руки» у 8 испытуемых это оказалась левая рука, а при определении «ведущего глаза» у
10 человек ведущим оказался правый глаз. Какова вероятность того, что у произвольно выбранного
человека данной группы ведущим будут левая рука или левый глаз?
Решение. Пусть событие А ={у выбранного человека ведущая левая рука};
В = {у выбранного человека ведущий левый глаз}. Тогда , Р( А) 8 0,4 Р(В) 20 10 0,5
.
20
20
События А и В совместны и независимы, поэтому
P( A B) P( A) P( B) P( A) P( B) 0,4 0,5 0,4 0,5 0,7
Следствием теорем сложения и умножения являются формула полной вероятности и формула
Байеса.
24.02.2014
5
6. Формула полной вероятности
Теорема 2. Вероятность события , появление которого возможно
лишь
при наступлении одного из несовместных событий образующих полную
группу ( i 1,2,...n ), равна сумме попарных произведений вероятностей
каждого из этих событий на соответствующую условную вероятность
события :
P( A) P( B1 ) PB1 ( A) P( B2 ) PB2 ( A) ... P( Bn ) PBn ( A)
24.02.2014
6
7. Пример.
В деканат поступили работы (результаты тестирования) по трем предметам в
соотношении 2:3:5. При этом вероятности неудовлетворительной оценки по каждому из
этих предметов соответственно равны 0,05; 0,02 и 0,08. Определить вероятность того,
что взятая наугад работа окажется неудовлетворительной.
Решение. Обозначим А – взятая наугад работа – неудовлетворительная.
Гипотезы: B– взята наугад работа по i-му предмету. ( i=1,2,3).
i
Вероятности гипотез: P( B1 ) 2 / 10 P( B2 ) 3 / 10 P ( B3 ) 5 / 10
Условные вероятности события А: PB ( A) 0,05 PB ( A) 0,02 PB3 ( A) 0,08
Обратим внимание, что сумма этих вероятностей равна 1.
Отсюда при n=3 получаем искомую вероятность события А:
1
P( A)
2
P( B1 ) PB1 ( A) P( B2 ) PB2 ( A) P( B3 ) PB3 ( A)
0,2 0,05 0,3 0,02 0,5 0,08 0,056.
24.02.2014
7
8. Формула Байеса
Значение формулы Байеса состоит в том, что при наступлении события (т.е. по мере
получения новой информации), мы можем проверять и корректировать выдвинутые до
испытания гипотезы. Такой подход называется байесовским. Он дает возможность
корректировать управленческие решения в экономике, принимать решения в условиях риска и
неопределенности и т.п.
Формула Байеса (или формула гипотез):
PA ( Bi )
P( Bi ) PBi ( A)
n
(i 1, 2,...,n)
P( Bi ) PBi ( A)
i 1
24.02.2014
8
9. Пример.
В группе 25 студентов: 5 «отличников» по математике, 10
«хорошистов», 8 «троечников» и 2 «двоечника». «Отличник» решает любую
задачу с вероятностью 1, «хорошист» – с вероятностью 0,9, «троечник» – с
вероятностью 0,7, «двоечник» – с вероятностью 0,5. Наугад вызванный студент
решил предложенную задачу. Какова вероятность того, что был вызван
«хорошист»?
Решение. Событие ={предложенная задача решена}. К какой группе
относится решивший еѐ студент – неизвестно. Выдвигаем гипотезы:
B1 = {задачу решил «отличник»}, B2 = { задачу решил «хорошист»},
B3 = {задачу решил «троечник»}, B4 = { задачу решил «двоечник»}.
24.02.2014
9
10. Решение.
По классическому определению вероятности находим:
10
5
8
P ( B2 )
0,4
P( B1 )
0,2
P( B3 )
0,32 P( B4 )
25
25
25
2
25
0,08
Условные вероятности заданы:
PB1 ( A) 1
PB2 ( A)
0,9
PB3 ( A) 0,7
PB4 ( A) 0,5
По формуле полной вероятности определим:
P( A)
P( B1 ) PB1 ( A) P( B2 ) PB2 ( A) P( B3 ) PB3 ( A) P( B4 ) PB4 ( A)
0,2 1 0,4 0,9 0,32 0,7 0,08 0,5 0,824.
По формуле Байеса находим искомую вероятность:
PA ( B2 )
24.02.2014
P ( B2 ) PB2 ( A)
P ( A)
0,4 0,9
0,824
0,44
10
11. Принятие решений на основе Байесовских стратегий
(Ганичева)
Постановка задачи заключается в следующем. Имеются две альтернативные гипотезы В1 и
В2 (случай трех гипотез и более рассматривается аналогично).
Например, В1 – на должность заместителя директора походит кандидатура Смирнова; В2 – на
должность заместителя директора походит кандидатура Егорова (здесь рассматриваются всего две
кандидатуры).
На основе мнения сотрудников, статистических и иных данных задаются вероятности этих
гипотез. В рамках каждой гипотезы рассматриваются все возможные последствия, на основе которых
по формулам Байеса происходит уточнение (перерасчет0 вероятностей гипотез.
Какую из гипотез выбрать: гипотезу, имеющую большую вероятность или гипотезу с меньшей
вероятностью?
Конечно, более достоверна гипотеза с большей вероятностью. Однако, на самом деле может
иметь место как раз гипотеза с меньшей вероятностью. Поэтому при выборе гипотез можно совершить
ошибку. Например, с точки зрения общества обвинить невинного человека хуже, чем оправдать
виновного. Для учета этого обстоятельства вводятся коэффициенты k1 и k2 , характеризующие
соответственно величину ошибок при принятии гипотез В2 вместо В1 и В1 вместо В2. Эти
коэффициенты называют также коэффициентами сожаления. Пусть событие А характеризует
данные, относящиеся к делу.
Для каждой гипотезы В1 и В2 вычисляется так называемый байесовский риск,
обозначаемый R1 и R2 соответственно. А именно: R1 k 2 PA ( B2 ) , R2 k1 PA ( B1 ) , где R1 характеризует
величину риска при выборе гипотезы В1 , R2 – при выборе гипотезы В2 .
Далее выбирается та гипотеза, для которой указанный риск является наименьшим.
24.02.2014
11
12. Пример.
Иван Петрович Мизинцев, решив жениться, подал объявление в газету и получил ответ от двух
претенденток:
Анастасия: живет в Москве, филолог по образованию, стройная и изящная, но далеко не красавица,
возраст 25 лет.
Кристина: проживает в Санкт-Петербурге, экономист, полноватая, с правильными чертами лица, но не
красавица, возраст 28 лет.
Кому должен отдать предпочтение Иван Петрович?
Решение. Выдвигаются две гипотезы: В1– отдать предпочтение Анастасии; В2– отдать предпочтение
Кристине.
Пусть, по мнению жениха, Р(В1 )=0,55 и Р(В2 )=0,45. рассматриваются сопутствующие факторы:
А1 – место проживания будущей супруги устраивает Мизинцева;
А2– профессия будущей супруги удовлетворяет Ивана Петровича;
А3– фигура девушки Мизинцеву нравится;
А4– лицо девушки привлекает жениха;
А5– возраст невесты подходит Мизинцеву.
24.02.2014
12
13. Решение
Пусть, например, Иван Петрович считает, что проживание невесты в Москве
устраивает его на 70%, а в Петербурге – на 60%; профессия филолога устраивает его на
50%, а экономиста – на 75%; поскольку Мизинцев отдает предпочтение стройным и
худощавым женщинам, то фигура Анастасии устраивает его на 90%, а Кристины – на
60%; Иван Петрович очень хочет иметь симпатичную жену, поэтому портрет Анастасии
подходит ему на 50%, а Кристины – на 80%; возраст обеих устраивает на 70%.
Поскольку Мизинцев заинтересован в совместном выполнении условий А1, А2 ,
А3, А4 , А5 ,то важно знать вероятность произведения этих событий. Положив А= А1, А2 ,
А3, А4 , А5 и заметив, что события А1, А2 , А3, А4 , А5 независимы, найдем условную
вероятность события А в рамках каждой из гипотез, а именно:
РВ1 ( А)
24.02.2014
0,7 0,5 0,9 0,5 0,7
0,11 Р В ( А)
2
0,6 0,75 0,6 0,8 0,7
0,15
13
14. Решение
Далее осуществляется перерасчет вероятностей гипотез по формулам Байеса:
Р А ( В1 )
Р А ( В2 )
Р ( В1 ) Р В1 ( А)
Р ( А)
Р ( В2 ) РВ2 ( А)
Р ( А)
0,55 0,11
0,55 0,11 0,45 0,15
0,47
0,45 0,15
0,55 0,11 0,45 0,15
0,53
Затем вводятся коэффициенты сожаления k1 и k2, которые характеризуют ошибки принятия
гипотез и B1 и B2 соответственно. Например, допустим, что Иван Петрович больше боится потерять
Анастасию, поэтому изначально отдал ей большее предпочтение: 55% против 45% у Кристины. Тогда он
полагает k1= 4 и k2 =2.
После этого вычисляются риски: R1 k 2 PA ( B2 ) = 2∙0,53 = 1,06 – риск принятия гипотезы ,
R2 k1 PA ( B1 ) = 4∙0,47 = 1,88 – риск принятия гипотезы B2 .
Выбирается та гипотеза, для которой риск имеет наименьшее значение, т.е. гипотеза . Таким образом,
Иван Петрович Мизинцев должен отдать предпочтение Анастасии.
24.02.2014
14
15. Решение
Мы рассмотрели случай двух альтернативных гипотез. В общем случае все рассуждения
проводятся совершенно аналогично. Например, в случае трех гипотез вводятся коэффициенты
сожаления k ij , которые характеризуют ошибку принятия гипотезы B i вместо гипотезы B j . Затем
вычисляются риски: R1 k12 PA ( B2 ) k13 PA ( B3 ) ; R2 k 21 PA ( B1 ) k 23 PA ( B3 ) ; R3 k31 PA ( B1 ) k32 PA ( B2 )
Принимается гипотеза, для которой величина риска наименьшая.
Рассмотренный метод дает возможность прогнозировать оптимальные стратегии и
соответственно планировать действия.
В рассмотренном примере не учитывался приоритет исходных данных А1, А2 , А3, А4 , А5.
Однако можно было задать коэффициенты приоритета этих условий.
В случае наличия приоритетов вероятность каждого условия Аi умножается на
соответствующий коэффициент, а далее все вычисления проводятся согласно рассмотренному методу.
24.02.2014
15