数学建模社区-数学中国

标题: 强化学习 [打印本页]

作者: 2744557306 时间: 2024-8-18 09:59
标题: 强化学习
在《强化学习》第二版的序言中，作者说明了自1998年首版以来，人工智能特别是强化学习领域的快速发展，使得出版新版本显得必要。第二版旨在继续提供清晰的强化学习核心思想和算法介绍，增加一些新主题并扩展已有内容，但不求全面覆盖该领域的所有进展。

新版本在符号上进行了改进，以减少常见的混淆，强调随机变量（用大写字母表示）与其具体值（用小写字母表示）之间的区别。例如，状态、动作和奖励用St、At和Rt表示，而具体值用s、a和r表示。价值函数用小写字母表示，表格估计用大写字母表示。向量用粗体小写字母表示，随机变量仍然适用。作者也对现有的转移概率和期望奖励表示法进行了改进，以更好地反映奖励的动态特征。

Reinforcement Learning.Sutton.pdf

18.44 MB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力 [记录] [购买]

欢迎光临数学建模社区-数学中国 (http://www.madio.net/)