madio 发表于 2020-8-17 09:26

深入浅出强化学习原理入门(郭宪,方勇纯)

本书⽤通俗易懂的语⾔深⼊浅出地介绍了强化学习的基本原理,覆盖
了传统的强化学习基本⽅法和当前炙⼿可热的深度强化学习⽅法。开篇从
最基本的⻢尔科夫决策过程⼊⼿,将强化学习问题纳⼊到严谨的数学框架
中,接着阐述了解决此类问题最基本的⽅法——动态规划⽅法,并从中总
结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。基于
这个思路,分别介绍了基于值函数的强化学习⽅法和基于直接策略搜索的
强化学习⽅法。最后介绍了逆向强化学习⽅法和近年具有代表性、⽐较前
沿的强化学习⽅法。


464721794 发表于 2020-11-19 14:58

正是我需要的 太感谢了!

excaliburcys 发表于 2021-1-14 17:12

看看seesee

lbh 发表于 2022-2-13 17:50

谢谢分享!!
页: [1]
查看完整版本: 深入浅出强化学习原理入门(郭宪,方勇纯)