Inženjersko modeliranje - Miloš Milić, Aleksa Trajković, Filip Stamenković
1. Алекса Трајковић, Филип Стаменковић, Милош Милић
бивши ученици Одељења за физику, ГСМ Ниш
Фестивал НАУК НИЈЕ БАУК 10
недеља, 1. април 2018..
2. Предмет: моделирање у физици
Ојлеров метод
Семинарски радови
Рачунарство
Грађевинарство
Фестивал НАУК НИЈЕ БАУК 10
недеља, 1. април 2018..
4. Фестивал НАУК НИЈЕ БАУК 10
недеља, 1. април 2018..
Соба димензија a×a
Брзина миша: v
Брзина мачке: vm = k v
Почетни тренутак:
суседни углови
Путања мачке?
Манчевљева мачка,
k = 2
5. 𝑦 𝑛+1 = 𝑦𝑛 + 𝑘𝑣 sin 𝛼 ∆𝑡
𝑥 𝑛+1 = 𝑥 𝑛 + 𝑘𝑣 c𝑜𝑠 𝛼 ∆𝑡
𝑚 𝑛+1 = 𝑚 𝑛 + 𝑣∆𝑡
Фестивал НАУК НИЈЕ БАУК 10
недеља, 1. април 2018..
6. 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
Y
X
k = 2 ( n = 1000 )
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
Y
X
n = 10 ( Y = 0,56378 )
n = 50 ( Y = 0,65978 )
n = 100 ( Y = 0,65661 )
n = 1000 ( Y = 0,66566 )
1 10 100 1000 10000 100000
0,56
0,58
0,60
0,62
0,64
0,66
0,68
Y
n
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
Y
X
k=1.618
k=2
k=3
k=4
k=5
k=6
Фестивал НАУК НИЈЕ БАУК 10
недеља, 1. април 2018..
7. Фестивал НАУК НИЈЕ БАУК 10
недеља, 1. април 2018..
Учење се заснива на интеракцији
са околином.
Систем затворене петље
Не постоји супервизор
Изабране акције имају
далекосежне последице.
8. 𝑄 𝑆𝑡, 𝐴 𝑡 ← 𝑄 𝑆𝑡, 𝐴 𝑡 + 𝛼ሾ 𝑅 𝑡+1 + 𝛾 max
𝑎
𝑄 𝑆𝑡+1, 𝑎 − 𝑄 𝑆𝑡, 𝐴 𝑡 ]
Процене се ажурирају након
сваког корака – online
Када је простор стања и акције
довољно мали, функције
вредности можемо представити
табеларно.
Фестивал НАУК НИЈЕ БАУК 10
недеља, 1. април 2018..
9. 𝑄 𝜃 𝑠, 𝑎 = 𝜃0 ∙ 1 + 𝜃1 𝑓1 𝑠, 𝑎 + ⋯ + 𝜃 𝑛 𝑓𝑛 𝑠, 𝑎
𝜃𝑖 = 𝜃𝑖 + 𝛼ሾ𝑅 𝑠 + 𝛾𝑚𝑎𝑥 𝑎′ 𝑄 𝜃 𝑠′, 𝑎′ − 𝑄 𝜃 𝑠, 𝑎 ]
𝜕𝑄 𝜃 𝑠, 𝑎
𝜕𝜃𝑖
Фестивал НАУК НИЈЕ БАУК 10
недеља, 1. април 2018..
Уместо велике табеле Q вредности, чувамо тежине 𝜃 𝑛.
𝑛 ≪ 𝒮
„Компресија коју постиже апроксиматор функције
омогућава обучаваном агенту да, на основу стања која
је посетио, уопштава нa стања која није посетио.“
Линеарна регресија:
10. -25
-20
-15
-10
-5
0
5
10
15
20
25
10 20 30 40 50 60 70 80 90 100 110
Prosečan rezultat agenta za vreme treniranja
u zavisnosti od broja epizoda
Aproksimativni Q-learning Random agent
11. Фестивал НАУК НИЈЕ БАУК 10
недеља, 1. април 2018..
Треба одредити: брзину, путању и
најповољнији угао постављања
Циљ: највећи домет
Маса: (50+50) g
Брзина избацивања горива:
150 m/s (540 km/h)
Трајање пропулзије: 1 s
Почетни угао
12. Могуће путање и домет
Фестивал НАУК НИЈЕ БАУК 10
недеља, 1. април 2018..