2018-08-23から1日間の記事一覧
www.youtube.com Slides, Notes David Silver先生のRLの講義、第5回目はModel-Free Control やっとoptimal policyを求める手法まで来ました、ここまでちょい長かったです。 今回の講義では下記の手法が紹介されました。やっとQ-Learningまできましたね。 こ…
www.youtube.com Slides, Notes David Silver先生のRLの講義、第5回目はModel-Free Control やっとoptimal policyを求める手法まで来ました、ここまでちょい長かったです。 今回の講義では下記の手法が紹介されました。やっとQ-Learningまできましたね。 こ…