深入浅出强化学习原理入门(郭宪,方勇纯)
本书⽤通俗易懂的语⾔深⼊浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本⽅法和当前炙⼿可热的深度强化学习⽅法。开篇从
最基本的⻢尔科夫决策过程⼊⼿,将强化学习问题纳⼊到严谨的数学框架
中,接着阐述了解决此类问题最基本的⽅法——动态规划⽅法,并从中总
结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。基于
这个思路,分别介绍了基于值函数的强化学习⽅法和基于直接策略搜索的
强化学习⽅法。最后介绍了逆向强化学习⽅法和近年具有代表性、⽐较前
沿的强化学习⽅法。
正是我需要的 太感谢了!
看看seesee
谢谢分享!!
页:
[1]