QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 910|回复: 2
打印 上一主题 下一主题

如何写出比 MATLAB 更快的矩阵运算程序?

[复制链接]
字体大小: 正常 放大

20

主题

10

听众

80

积分

升级  78.95%

  • TA的每日心情
    开心
    2015-9-12 12:05
  • 签到天数: 21 天

    [LV.4]偶尔看看III

    自我介绍
    爱你么么哒

    社区QQ达人 新人进步奖

    跳转到指定楼层
    1#
    发表于 2015-4-9 20:48 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    MATLAB 似乎将矩阵运算优化得非常之好,比手写的 C 程序运算 2D 数组还快。想知道它是怎么做到的,有没有办法能比它做得更好。
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信

    10

    主题

    10

    听众

    66

    积分

    升级  64.21%

  • TA的每日心情
    开心
    2015-5-3 10:55
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    自我介绍
    爱学习, 爱生活

    社区QQ达人

    群组2015年数学中国“建模

    回复

    使用道具 举报

    5

    主题

    9

    听众

    34

    积分

    升级  30.53%

  • TA的每日心情
    开心
    2015-4-14 18:58
  • 签到天数: 4 天

    [LV.2]偶尔看看I

    自我介绍
    不知道,或许吧

    社区QQ达人

    矩阵乘法是一个相对成熟的问题,根据矩阵的稀疏程度有不同的优化算法。
    不使用GPU加速的MATLAB版本采用的是BLAS中的General Matrix Multiplication[1]。学术界有各种矩阵乘法算法将其复杂度降低到O(n^2.x),例如Strassen和Winograd算法,在BLAS中应该已经使用了Strassen算法。
    如果你的MATLAB是安装了Parallel Computing Toolbox的话,那么很可能它已经在使用GPU进行计算了。这种情况下采用的是MAGMA[2]。我没有使用过MAGMA,但我猜测它应该使用了cuBLAS来计算矩阵乘法。
    宏观角度上对矩阵乘法的优化包括对局部内存使用的优化(Blocked/Tiled)以及对中间运算步骤的优化(Strassen/Winograd),实现细节上的优化就非常繁多了。比如loop unrolling,多级的tiling,指令级并行等等。其中会牵扯到一些编译器和体系结构的知识,似乎对仅仅希望使用矩阵乘法函数的用户来讲没有什么太大必要去探究。所以我认为写出比MATLAB更快的矩阵乘法是可行但困难的。
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-11-9 17:04 , Processed in 2.139942 second(s), 62 queries .

    回顶部