<aside> 🤔

강화학습은 마르코프 의사 결정 과정(Markov decision process, MDP)의 개념을 활용한 것이다. 그러므로 MDP에 대해 잘 이해하는 것이 강화학습 시스템 개발에 있어 중요하다.

</aside>

마르코프 가정 (Markov assumption)

마르코프 과정 (Markov Process)

마르코프 의사 결정과정(Markov decision process, MDP)