jwata blog

勉強の記録や思ったことなど

2018-08-19から1日間の記事一覧

RL勉強記録: Planning by Dynamic Programming

今日はDavid Silver先生のUCL Course on RLのLecture3を見ました。 www.youtube.com [Slides],[Note] 内容的にはこんな感じでした。 Policy evaluation Policy iteration Value iteration プラス計算効率化のアイデア Udacity DeepLearning Nanodegreeでやっ…

RL勉強記録: Markov Decision Processes

UCL Course on RL by David Silver のLecture2はMarkov Decision Processesの定義について。 いつも混同してしまっていたので、おさらいに良かった。 www.youtube.com Slides ノート https://www.evernote.com/l/ADy-blY1XhZMyYgwME5IaI5y2dhQ4piSqDs