дбс1 1

Динамические байесовские сети и
их приложения.

Смирнова Н.В.

ИПУ РАН, 2011
1

Определение БС - 1
БС – графическая вероятностная модель

A P(a)  0.5

P(b|a)  0.9
B P(b|a)  0.3

A, B булевские (принимают значения из {true, false}
(могут быть непрерывными, дискретными)
2

Используемые обозначения - 1

P( A true) P(a)
P( A false) P(a)

Априорная вероятность всех возможных значений
сл. величины:

P( A) - вектор,
P( A)  P(a), P(a) 

3

Используемые обозначения - 2

P( A, B,C) - вектор, полное совместное распределение
случайных величин A, B,C
P( A, B,C)  P(a,b,c),P(a,b,c),..., P(a,b,c) 

P( A|B)  P(a |b), P(a |b), P(a |b), P(a |b) 

4

Определение вероятности,
используемое в байесовских сетях-1
Классический подход:

P(d |s)  P(d ,s)
P(s)

D  «пациент болеет бронхитом»

S  «у пациента есть одышка»

P(d ,s), P(s) - такая информация обычно недоступна.

5


Объективная Субъективная
частота вероятность
n независимых оценки
испытаний, совместного
n появления событий

6

Эффект
«оттеснения других объяснений»-1

P(a)  0.7 P(b)  0.3
A B
бронхит туберкулез

С P(c|a,b)  0.9
кашель P(c|a,b)  0.4
P(c|a,b)  0.7
P(c|a,b)  0.1

Эффект
A B
бронхит туберкулез

С
кашель
Эффект: формальная запись
P(a|c)  0.903 P(a|b,c)  0.84 P(b|c)  0.382 P(b|a,c)  0.355

Неформальная запись:
Известно: одышка, бронхит, тогда P(туберкулез)
Известно: одышка, туберкулез, тогда P(бронхит)

Эффект
P(a|c)  P(a,c)
P(a,c) P(a,c)
P(a,c)   P( A,B,C)  P(a,b,c)  P(a,b,c)
A a, B,C c

P(a,b,c)  P(a)P(b)P(c|a,b)
P(a,b,c)  0.189, P(a,b,c)  0.343
(Расчеты к
P(a,c)  0.532 предыдущему
P(a,b,c)  0.036, P(a,b,c)  0.021 примеру)
P(a,c)  0.057
P(a|c)  0.532  0.903
0.5320.057

Эффект
P(b|c)  P(b,c)
P(b,c) P(b,c)
P(b,c)   P( A,B,C)  P(a,b,c)  P(a,b,c)
A, B b,C c

P(a,b,c)  P(a)P(b)P(c|a,b)
P(a,b,c)  0.189, P(a,b,c)  0.036
(Расчеты к
P(b,c)  0.225 предыдущему
P(a,b,c)  0.343, P(a,b,c)  0.021 примеру)
P(b,c)  0.364
P(b|c)  0.225  0.382
0.2250.364

Эффект

P(b|a,c)  P(b,a,c)
P(b,a,c) P(b,a,c)
P(b,a,c)  0.189, P(b,a,c)  0.343
P(b|a,c)  0.189  0.355
0.1890.343
(Расчеты к
P(a|b,c)  P(a,b,c) предыдущему
P(a,b,c) P(a,b,c) примеру)
P(a|b,c)  0.189  0.84
0.1890.036

Определение ДБС-1
ДБС определяется как БС следующего вида:
Последовательность скрытых
X0 X1 Xn состояний,
… изменяющихся с течением
времени

E1 En Каждое состояние зависит только
от предыдущего

X t - скрытые, Каждое состояние
характеризуется скрытыми и
Et - наблюдаемые наблюдаемыми переменными
переменные

Определение ДБС-2. Пример «с
зонтиком»
 Охранник никогда не выходит на улицу.
 По утрам охранник видит директора (иногда с зонтиком)
 Какова вероятность дождя на улице?

Xt Raint 1 Raint Raint 1
…

Et Umbrellat 1 Umbrellat Umbrellat 1

Далее будет использоваться обозначение:
X1,..., X t X1 : t , x1,..., xt x1 : t

Определение ДБС-3. Задаваемые
параметры

X0 X1 Xn
…

E1 En

Параметры:
P( X 0)
P( X t | X t 1) «модель перехода»
P(Et | X t ) «модель наблюдения»

Определение ДБС-4. Пример «с
зонтиком»
P(R  r)  0.5
0 P(R  r | R  r)  0.7
t t 1

R0 R1 P(R  r | R  r)  0.3
t t 1

U1 P(U  u| R  r)  0.9
t t

P(U  u| R  r)  0.2
t t

Основные задачи вероятностного
вывода в ДБС-1
(1) Фильтрация (текущий контроль): P( X t |e1 : t )
# вероятность дождя сегодня, если даны все
результаты наблюдений за директором

(2) Предсказание: P( X t k |e1 : t ), k  0
# вероятность дождя через несколько дней,
если даны все результаты наблюдений за
директором

18

Основные задачи вероятностного
вывода в ДБС-2
(3) Сглаживание (ретроспективный анализ):
P( X k |e1 : t ), 0 k t
# вероятность того, что дождь шел в прошлую
среду, если даны все результаты наблюдений
за директором
(4) Наиболее правдоподобное объяснение:
arg max P( X 1 : t |e1 : t )
X1 : t

# если директор приходил с зонтиком первые
три дня, а в четвертый – без зонтика, найти
погоду в каждый из прошедших дней 19

Вероятностный вывод в ДБС. 1
способ (неэффективный)
Воспринимать ДБС как обыкновенную БС:
X X X P( X 2 | E1 : 2) ?
0 1 2

P(x2 |e1,e2)  P(x2,e1,e2)
P(x2,e1,e2) P(x2,e1,e2)
E1 E2
(опр. усл. вер.
+
прием «нормализация»)
P(x2,e1,e2)  P(x0, x1, x2,e1,e2)  P(x0, x1, x2,e1,e2)  P(x 0 , x1, x2,e1,e2) 
 P(x 0 , x1, x2,e1,e2) (ф-ла полн. вер.)
P(x0, x1, x2,e1,e2)  P(x0)P(x1 | x0)P(e1 | x1)P(x2 | x1)P(e2 | x2) (декомп.)

способ (эффективный)-1
Два вида шагов:

1. проектирование распределения вероятностей
предыдущего состояния от t к t+1
(используется P( X t | X t 1) )

2. Обновление распределения вероятностей текущего
состояния
Xt
(используется P(Et | X t ) )
P( X t | X t 1)
В памяти хранится только: P(Et | X t )
Et

способ (эффективный)-2
Продолжая «пример с зонтиком»: пусть было
R0
Получили: конкретное значение U1
цикл
Достраиваем:
(1) : P(Rt  r)   P(Rt |Rt 1)P(Rt 1)
R0 R1 Rt 1,Rt r
(2) : P(Rt  r |Ut )  P(Rt r,Ut )
(1) P(Rt r,Ut ) P(Rt r,Ut )
U1
P(Rt  r,Ut )  P(Ut | Rt  r)P(Rt  r)
(2)
Получили: R1 Ждем U 2...

Вероятностный вывод в ДБС.
Алгоритм фильтрации частиц-1
Дано: X - случайная величина с областью значения
{x1,..., xn}
Операция сэмплирования sample( X ): xk ,1 k  n
Выбор xk осуществляется с помощью P( X  xi ) (P( xi ))

xi 1 2 3
#
P( X  xi ) 0.3 0.6 0.1

Возможный способ осуществления sample( X ):
P( x1) P( x ) P( x3)
(1) 2

0 p1 1
p2

(2) генерируется случайное число s[0, 1]

 x1 , если s[0, p1)

(3) 
sample( X )  x2 , если s[ p1, p2 )







x3 , если s[ p2 , p3]

Результатом sample(BN ) является совокупность
конкретных значений всех узлов байесовской сети

R0 R1 # sample(BN ) {R0  r, R1  r, U1  u}

Реализация sample(BN ):
U1
последовательное применение
sample( X ) к каждому узлу сети
в топологическом порядке
Для наблюдаемых переменных берется наблюденное
значение

Операция Weighted  sample(BN ) возвращает:
:
-совокупность конкретных значений (выборку) БС,
-вес выборки (насколько согласуется с наблюдениями)

P( x )  0.3 # Пусть известно наблюдение
X1 1
X 2  x2 и получена выборка

P( x | x )  0.8
2 1 а) {x1, x2}, тогда вес выборки
X2
P( x | x )  0.7
2 1
W  P( x2 | x1)  0.8
б) { x1, x2}, тогда вес выборки
W  P( x2 | x1)  0.7

Теперь объяснение всего алгоритма фильтрации на
«примере с зонтиком»
P(R1 |U1  u)  ?
R0 R1
Шаг 1. С помощью Weighted  sample(BN )
формируем N взвешенных выборок
U ДБС (пусть N=10 для наглядности)
1

# S1 {R0  r, R1  r, U1  u}, W (S1)  P(U1  u | R1  r)
S1 {R0  r, R1  r, U1  u}, W (S1)  P(U1  u |R1  r)
S1 {R0  r, R1  r, U1  u}, W (S1)  P(U1  u |R1  r)
…

S1 {R0  r, R1  r, U1  u}, W (S1)  P(U1  u | R1  r)
S2 {R0  r, R1  r, U1  u}, W (S2)  P(U1  u | R1  r)
S3 {R0  r, R1  r, U1  u}, W (S3)  P(U1  u | R1  r)
S4 {R0  r, R1  r, U1  u}, W (S4)  P(U1  u | R1  r)
S5 {R0  r, R1  r, U1  u}, W (S5)  P(U1  u | R1  r)
S6 {R0  r, R1  r, U1  u}, W (S6)  P(U1  u | R1  r)
S7 {R0  r, R1  r, U1  u}, W (S7)  P(U1  u | R1  r)
S8 {R0  r, R1  r, U1  u}, W (S8)  P(U1  u | R1  r)
S9 {R0  r, R1  r, U1  u}, W (S9)  P(U1  u | R1  r)
S10 {R0  r, R1  r, U1  u}, W (S10)  P(U1  u | R1  r)

6 выборок типа S1 {R0  r, R1  r, U1  u} с весом 0.1
(веса см. по таблицам условных вероятностей)

2 выборки типа S2 {R0  r, R1  r, U1  u} с весом 0.8

2 выборки типа S3 {R0  r, R1  r, U1  u} с весом 0.8

Далее формируем случайную величину S :

si #S1 #S2 #S3 P(S  s1)  0.16
P(S  si ) 0.16 0.42 0.42 0.1620.820.8

N раз применяем операцию сэмплирования к S:
si #S1 #S2 #S3
P(S  si ) 0.16 0.42 0.42

Получаем (например):

1 выборка типа S1
3 выборки типа S2
6 выборок типа S3

Теперь можем вычислить ответы на поставленные
вопросы.

Имеем:
1 выборка типа S1 S1 {R0  r, R1  r, U1  u}
3 выборки типа S2 S2 {R0  r, R1  r, U1  u}
6 выборок типа S3 S3 {R0  r, R1  r, U1  u}

P(R1  r |U1  u)  N (выборок, где R1r)
N (выборок)

P(R1  r |U1  u)  1 , P(R1  r |U1  u)  36  9
10 10 10

Шаги алгоритма:

1. формируется N взвешенных выборок ДБС
2. на основе этих данных составляется случайная
величина S, значениями которой являются ссылки на
сгенерированные типы выборок
3. N раз Sample(S) – получаем N «новых» выборок
4. с помощью простой формулы на «новых» выборках
вычисляем ответы на интересующие нас вопросы

Применение ДБС-1. Задача
локализации робота.

Два основных вопроса:

1) Как представлять состояние робота
(требуется много памяти или нет?)

2)Что представляют собой «модели наблюдения»
и «модели перехода»?

2): не хранятся в памяти в виде таблиц.
Рассчитываются по формулам!
1) см. далее.

0.0 0.1 0.0 Состояние робота представляется с
помощью частиц
0.0 0.0 0.2

0.0 0.2 0.5
Частица: ( x, y): P( X  x,Y  y)  0

В памяти компьютера:

(1,2),
(2,3), (2,3),
(3,2), (3,2),
(3,3), (3,3), (3,3), (3,3), (3,3)

Частицы передвигаются согласно модели перехода

Частицы взвешиваются согласно модели наблюдений

Генерируются новые частицы с помощью операции
сэмплирования:

(у новых частиц
веса все равны 1)
Наиболее
вероятное
местоположение
робота

Спасибо за
внимание!

39

Инф. источники:
Большое количество слайдов/
Рассел, Норвиг «Искусственный интеллект: современный подход»

Слайд 5-8,9/
http://sapr.mgsu.ru/biblio/ex-syst/Glava9/Index4.htm

Слайд 24/
Д. Кнут. Том 2. Глава 3

Слайды 33, 35-38/
CS 221: Artificial Intelligence. Lecture 5: Hidden Markov Models and
Temporal Filtering (Thrun, Norvig)

дбс1 1

Recommended

Recommended

More Related Content

What's hot

What's hot (19)

More from Natalia Smirnova

More from Natalia Smirnova (9)

дбс1 1