본문 바로가기

강화 학습

Ch 3. 벨만방정식

3.1 벨만 기대 방정식 

 

State Value Function과 State-Action Value Function(큐함수)에 관한 정의. 

 

 

'강화 학습' 카테고리의 다른 글

바닥부터 배우는 강화학습  (0) 2021.04.07