[2023-동계모각코] 1회차 결과

2024. 1. 9.

by. 안녕진

강화학습을 위한 기본 내용들

- 보상을 극대화 하기

- 상태와 행동이 연관된 문제

- 상태와 행동이 연관되고, 누적 반환을 고려하는 방법

- 사람이 생각하는 휴리스틱 방법론에 접근했을 때 보상을 부여하는 것이 아닌, 최종 목표에 맞는 형태로 보상을 주는 것이 적합

- 벨만 방정식

마인드맵 기본 UI 작성 완료

[2023-동계모각코] 2회차 계획 (0)	2024.01.15
[2023-동계모각코] '김이냐 짐이냐 그것이 문제로다' 팀 1회차 결과 링크 (0)	2024.01.09
[2023-동계모각코] '김이냐 짐이냐 그것이 문제로다' 팀 1회차 계획 링크 (0)	2024.01.09
[2023-동계모각코] 1회차 계획 (0)	2024.01.09
[2023-동계모각코] '김이냐 짐이냐 그것이 문제로다' 팀 전체 계획 (2)	2024.01.01

맨 위로

녕로그
App 개발, 머신러닝을 공부하는 블로그입니다.