개발/2023-동계모각코
[2023-동계모각코] 4회차 결과
- 강화학습 테트리스(tetr.io)에 적용해보기 화면 캡처를 위한 토대를 구축하였다. 게임 화면 위치가 쉽게 변경될 수 있는 환경 특징 상, 유저가 쉽게 캡처 위치를 지정하도록 만들었다. - 혁펜하임 강화학습 강의 정리하기 사용할 Bayesian Rule $$ \begin{align} p(x, y) = p(x | y)\ p(y) \ p(x, y | z) = p(x | y, z)\ p(y | z) \end{align} $$ 상태 가치 함수 전개 $$ \begin{align} V(s_t) &\ \dot= \int_{a_t: a_\infty} G_t\ p(a_t, s_{t+1}, a_{t+1}, \cdots |s_t) d_{a_t: a_\infty} \tag{1} \ & = \int_{a_t} \int_{s..
2024. 1. 28.