한국인공지능연구소 소속 강화학습연구소에서 복습용으로 쓰인 PPT입니다. MDP, Monte-Carlo, Time-difference, sarsa, q-learning에 대하여 설명되어 있습니다.Leia menos