数学建模社区-数学中国

标题: 强化学习 [打印本页]

作者: 2744557306    时间: 2024-8-18 09:59
标题: 强化学习
在《强化学习》第二版的序言中,作者说明了自1998年首版以来,人工智能特别是强化学习领域的快速发展,使得出版新版本显得必要。第二版旨在继续提供清晰的强化学习核心思想和算法介绍,增加一些新主题并扩展已有内容,但不求全面覆盖该领域的所有进展。3 R( p( @$ H3 K3 {. n
$ M" {8 l3 r+ P2 g0 D
新版本在符号上进行了改进,以减少常见的混淆,强调随机变量(用大写字母表示)与其具体值(用小写字母表示)之间的区别。例如,状态、动作和奖励用St、At和Rt表示,而具体值用s、a和r表示。价值函数用小写字母表示,表格估计用大写字母表示。向量用粗体小写字母表示,随机变量仍然适用。作者也对现有的转移概率和期望奖励表示法进行了改进,以更好地反映奖励的动态特征。# U; k1 q6 t2 N- P
. w: F! U: ~( l0 k; R
, C  b$ a* G1 R" n3 O
- v' J: x" X' x- [8 P! R7 T  E

Reinforcement Learning.Sutton.pdf

18.44 MB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]






欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5