数学建模社区-数学中国

标题: 强化学习 [打印本页]

作者: 2744557306    时间: 2024-8-18 09:59
标题: 强化学习
在《强化学习》第二版的序言中,作者说明了自1998年首版以来,人工智能特别是强化学习领域的快速发展,使得出版新版本显得必要。第二版旨在继续提供清晰的强化学习核心思想和算法介绍,增加一些新主题并扩展已有内容,但不求全面覆盖该领域的所有进展。1 d6 L# z5 U6 v1 Y- X- g
4 K6 G: p9 F7 T9 _9 L( z. G
新版本在符号上进行了改进,以减少常见的混淆,强调随机变量(用大写字母表示)与其具体值(用小写字母表示)之间的区别。例如,状态、动作和奖励用St、At和Rt表示,而具体值用s、a和r表示。价值函数用小写字母表示,表格估计用大写字母表示。向量用粗体小写字母表示,随机变量仍然适用。作者也对现有的转移概率和期望奖励表示法进行了改进,以更好地反映奖励的动态特征。
8 W+ `0 \* k1 \1 ~4 @0 _" ~4 f( S% U

  s( j; ]; ]! W: k6 s: B+ t4 b
% ^2 T$ D) t& ~2 c7 g0 d

Reinforcement Learning.Sutton.pdf

18.44 MB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]






欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5