QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 7000|回复: 3
打印 上一主题 下一主题

[书籍资源] 深入浅出强化学习原理入门(郭宪,方勇纯)

[复制链接]
字体大小: 正常 放大
madio        

3万

主题

1307

听众

5万

积分

  • TA的每日心情
    奋斗
    2021-5-1 20:26
  • 签到天数: 2013 天

    [LV.Master]伴坛终老

    自我介绍
    数学中国站长

    社区QQ达人 邮箱绑定达人 优秀斑竹奖 发帖功臣 风雨历程奖 新人进步奖 最具活力勋章

    群组数学建模培训课堂1

    群组数学中国美赛辅助报名

    群组Matlab讨论组

    群组2013认证赛A题讨论群组

    群组2013认证赛C题讨论群组

    跳转到指定楼层
    1#
    发表于 2020-8-17 09:26 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta |邮箱已经成功绑定
    本书⽤通俗易懂的语⾔深⼊浅出地介绍了强化学习的基本原理,覆盖
    - @0 F6 ]$ v* s% G, l% G' U( e5 Z了传统的强化学习基本⽅法和当前炙⼿可热的深度强化学习⽅法。开篇从
    % }& \4 M/ Y9 }' n( Y& r最基本的⻢尔科夫决策过程⼊⼿,将强化学习问题纳⼊到严谨的数学框架
    $ b, ]# i- D8 [- e' t. H% P1 `中,接着阐述了解决此类问题最基本的⽅法——动态规划⽅法,并从中总
    8 p4 g' ^: M2 K* }7 K结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。基于
    * [, j" b3 t& {- v这个思路,分别介绍了基于值函数的强化学习⽅法和基于直接策略搜索的8 l& n2 S4 B& @6 f  d1 v- s# y! Y, e7 S! y
    强化学习⽅法。最后介绍了逆向强化学习⽅法和近年具有代表性、⽐较前$ ^  _( J, z( m& m; e" R
    沿的强化学习⽅法。
    4 S5 B9 t& E( ?  Y: s9 I
    4 ]' l+ _* @/ M3 J& _* a
      @8 J9 _" r/ }* e$ k4 Y4 j

    深入浅出强化学习原理入门(郭宪,方勇纯).pdf

    57.77 MB, 下载次数: 11, 下载积分: 体力 -2 点

    售价: 8 点体力  [记录]

    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持1 反对反对0 微信微信
    数学建模社会化
    464721794 实名认证       

    0

    主题

    1

    听众

    15

    积分

    升级  10.53%

  • TA的每日心情
    奋斗
    2020-11-20 10:55
  • 签到天数: 1 天

    [LV.1]初来乍到

    邮箱绑定达人

    回复

    使用道具 举报

    14

    主题

    13

    听众

    636

    积分

    升级  9%

  • TA的每日心情
    奋斗
    2022-9-16 00:22
  • 签到天数: 63 天

    [LV.6]常住居民II

    邮箱绑定达人 社区QQ达人 社区QQ达人

    群组2016美赛交流群组

    群组数学中国美赛辅助报名

    回复

    使用道具 举报

    lbh        

    15

    主题

    9

    听众

    6346

    积分

    升级  26.92%

  • TA的每日心情
    奋斗
    2024-5-29 00:21
  • 签到天数: 1681 天

    [LV.Master]伴坛终老

    国际赛参赛者

    新人进步奖

    群组小草的客厅

    群组数学建模培训课堂2

    群组2011年第一期数学建模

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2024-5-29 03:32 , Processed in 0.455101 second(s), 71 queries .

    回顶部