<aside> 🤔
강화학습은 마르코프 의사 결정 과정(Markov decision process, MDP)의 개념을 활용한 것이다. 그러므로 MDP에 대해 잘 이해하는 것이 강화학습 시스템 개발에 있어 중요하다.
마르코프 의사 결정 과정(Markov decision process, MDP)
MDP
</aside>