% j7 D ?; |- P4 H0 j ^8 m3 |一种简单的方法是使用 CPU 多线程来并行运行所有计算。然而,当涉及深度学习模型时,我们正在处理包含数百万个元素的大量向量。一个普通的CPU只能同时处理大约十几个线程。这就是 GPU 发挥作用的时候!现代 GPU 可以同时运行数百万个线程,从而增强了海量向量上的数学运算的性能。+ Y0 D3 l2 B$ U, M; Y
3 I6 T2 B: j0 VGPU 与 CPU 比较 % w/ X/ l. |' g4 u, g" ?! |; d尽管对于单个操作,CPU 计算可能比 GPU 更快,但 GPU 的优势依赖于其并行化能力。其原因是它们的设计目标不同。 CPU 的设计目的是尽可能快地执行一系列操作(线程)(并且只能同时执行数十个操作),而 GPU 的设计目的是并行执行数百万个操作(同时牺牲单个线程的速度)。$ T& P7 C/ f+ {1 t; l: k/ G( l1 z
: i' M4 U% L0 C( {; E' i* u' |8 r
为了说明这一点,可以将 CPU 想象成一辆法拉利,将 GPU 想象成总线。如果您的任务是运送一个人,那么法拉利(CPU)是更好的选择。然而,如果您要运送几个人,即使法拉利(CPU)每次行程更快,公共汽车(GPU)也可以一次性运送所有人,比法拉利多次运送路线更快。因此,CPU 更适合处理顺序操作,GPU 更适合处理并行操作& m7 } L% q! z3 K
———————————————— - `) g0 }. H2 A3 c5 O' ]6 X# F/ G. _2 ]2 Z% R
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。, X z$ O1 e: J. u1 z$ K5 a/ g2 X
$ h( e& k0 D2 f$ _) \. m% {2 ^0 T d原文链接:https://blog.csdn.net/weixin_42010722/article/details/1382131215 m H' H; A/ y; `/ g: W