-
- 강화학습 교과서 읽기 (3단원 복습)
강화학습을 위한 기본 내용들
- 보상을 극대화 하기
- 상태와 행동이 연관된 문제
- 상태와 행동이 연관되고, 누적 반환을 고려하는 방법
- 사람이 생각하는 휴리스틱 방법론에 접근했을 때 보상을 부여하는 것이 아닌, 최종 목표에 맞는 형태로 보상을 주는 것이 적합
- 벨만 방정식
- Flutter 디딤돌 앱 개발
마인드맵 기본 UI 작성 완료
'개발 > 2023-동계모각코' 카테고리의 다른 글
[2023-동계모각코] 2회차 계획 (0) 2024.01.15 [2023-동계모각코] '김이냐 짐이냐 그것이 문제로다' 팀 1회차 결과 링크 (0) 2024.01.09 [2023-동계모각코] '김이냐 짐이냐 그것이 문제로다' 팀 1회차 계획 링크 (0) 2024.01.09 [2023-동계모각코] 1회차 계획 (0) 2024.01.09 [2023-동계모각코] '김이냐 짐이냐 그것이 문제로다' 팀 전체 계획 (2) 2024.01.01 댓글