- 在线时间
- 1267 小时
- 最后登录
- 2025-7-1
- 注册时间
- 2022-2-27
- 听众数
- 33
- 收听数
- 0
- 能力
- 90 分
- 体力
- 171299 点
- 威望
- 9 点
- 阅读权限
- 255
- 积分
- 54518
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1809
- 主题
- 1193
- 精华
- 33
- 分享
- 0
- 好友
- 33
TA的每日心情 | 奋斗 2025-6-24 09:53 |
---|
签到天数: 613 天 [LV.9]以坛为家II 网络挑战赛参赛者 - 自我介绍
- 我是普大帝,拼搏奋进,一往无前。
 |
你好!我是陪你一起进阶人生的范老师!愿你成才!助你成长!
你好!我是数学中国范老师,2025美赛还有一个月,赛前我将给大家准备一些相关资料用于备战,美赛开放性太强,所以我准备的这些资料的开放度也会很强。参加美赛的你知道在AI大模型如此强大的今天,你该具备什么样的技能吗?这是一篇名叫《通过在线多智能体学习改进LLM数学推理》的文章,是加州大学和微软研究院的最新研究成果。通过使用在线学习流和直接偏好优化,可以让LLM生成更加详细和精确的推理轨迹。同时,这种在线多智能体(Agent)的学习形式还能挖掘数据中的深层信息,有效避免了人类标注数据不够准确的问题。说的太学术大家可能不太理解,直白的说其实就是在解决问题时,让多个AI大模型在线互动,让AI与AI之间互相纠错互相优化,最终给出答案。模式是互同的能用来解数学题,也一样是可以解数学建模赛题。据我了解已经有人通过纯AI论文拿到了美赛F奖,大概率也就是这个模式办到的,这就是一个多AI协作的工作流模式,其实国内的字节跳动旗下的扣子Coze就是这样的平台,后面我自己也会去研究一下。大家可以先研究一下这个文章,明年的阿里巴巴全球数学竞赛也是可以用到的。
论坛下载,默认最低扣2个体力值,注册登录后,右上角点击签到就会随机赠送10点左右的体力值!点击文件图标可以立即下载文件。
新用户注册,可以联系我们的工作人员QQ南方:3242420264 乔叶:1470495151 淡妆:1917509892,帮你快速审核+修改用户组后,可以右上角签到获取体力值,一次注册,日后大量数学建模资源即刻拥有。
流量-DPO 通过在线多智能体学习改进LLM数学推理.pdf
(1.17 MB, 下载次数: 9, 售价: 5 点体力)
|
zan
|