QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 11014|回复: 1
打印 上一主题 下一主题

牛B的 John Carmack密码:0x5f3759df--Quake III的源代码分析

[复制链接]
字体大小: 正常 放大
5800        

1

主题

4

听众

16

积分

升级  11.58%

该用户从未签到

新人进步奖

跳转到指定楼层
1#
发表于 2009-11-26 23:24 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
有人在Quake III(雷神之锤3)的源代码里面发现这么一段用来求平方根的代码:( K' {4 z) n5 I* F7 ~% h
/*================SquareRootFloat================*/
# [# W8 ]* h# Ofloat SquareRootFloat(float number) {
6 \% k5 z! |' q/ y6 clong i;
9 q: ?$ X7 {' K' \% ~float x, y;
% h9 p1 H" s+ |( m1 |: Z) Kconst float f = 1.5F;0 x$ i. D4 o1 |
x = number * 0.5F;/ w6 R. _8 W# U/ F. j
y = number;: F4 D/ i: ?& k# g+ z/ y. _
i = * ( long * ) &y;
' q; ~! f# M/ o5 G' n' U( Ai = 0x5f3759df - ( i >> 1 ); //注意这一行, c" @0 J, t) D
y = * ( float * ) &i;5 K& G! L4 Z- K" }3 K, h' H
y = y * ( f - ( x * y * y ) );
6 u6 ^6 W0 g- t# z2 iy = y * ( f - ( x * y * y ) );
/ h0 E. Z( l$ R$ z8 D+ J- M3 |return number * y;
+ A! C/ u$ W8 m+ [+ p}
7 n4 D( u7 E3 Y+ t0x5f3759df? 这是个什么东西? 学过数值分析就知道,算法里面求平方根一般采用, Q9 f9 t! c5 n0 A$ S+ b9 f
的是无限逼近的方法,比如牛顿迭代法,抱歉当年我数值分析学的太烂,也讲不清楚% O/ z3 E6 z" S
。简单来说比如求5的平方根,选一个猜测值比如2,那么我们可以这么算
4 N1 v' M4 S) ~- z0 J5/2 = 2.5; 2.5+2/2 = 2.25; 5/2.25 = **; 2.25+**/2 = **x ...
+ \. A# ?9 N) G# s6 c( |/ y2 S这样反复迭代下去,结果必定收敛于sqrt(5),没错,一般的求平方根都是这么算的/ G+ S4 p( y6 R# I4 W
。而卡马克的不同之处在于,他选择了一个神秘的猜测值0x5f3759df作为起始,使得
1 t) ?$ ?! Z8 |1 h/ Q整个逼近过程收敛速度暴涨,对于Quake III所要求的精度10的负三次方,只需要一1 D5 W( B/ h/ T$ a* W, R
次迭代就能够得到结果。
% T( ]! W0 V1 Z8 y6 L! T7 e/ ]% H好吧,如果这还不算牛b,接着看。6 l( W! c; [+ P- t2 Q" ?( j, X
普渡大学的数学家Chris Lomont看了以后觉得有趣,决定要研究一下卡马克弄出来的0 x) B$ @: V6 k5 [; c! q/ s
这个猜测值有什么奥秘。Lomont也是个牛人,在精心研究之后从理论上也推导出一个: @6 z6 T2 A/ ?* f
最佳猜测值,和卡马克的数字非常接近, 0x5f37642f。卡马克真牛,他是外星人吗?
- r0 G7 R7 ~/ t6 E0 }/ U$ Y6 t9 o2 T0 d1 M) O8 G" O
传奇并没有在这里结束。Lomont计算出结果以后非常满意,于是拿自己计算出的起始! ^: J+ X  V3 K' r6 L$ {
值和卡马克的神秘数字做比赛,看看谁的数字能够更快更精确的求得平方根。结果是
9 ?- D, J' P) b卡马克赢了... 谁也不知道卡马克是怎么找到这个数字的。: f5 m8 j! C/ G1 f% @
最后Lomont怒了,采用暴力方法一个数字一个数字试过来,终于找到一个比卡马克数
3 _& Y  P$ R' z4 |. ^字要好上那么一丁点的数字,虽然实际上这两个数字所产生的结果非常近似,这个暴
8 \8 G7 x' m+ Y+ X力得出的数字是0x5f375a86。
2 r8 B7 p" S9 d# S- jLomont为此写下一篇论文,"Fast Inverse Square Root"。  P9 O8 ^- _9 ^* @/ G7 U- y4 C& h& B
John Carmack, ID的无价之宝。0 d9 I8 l' w1 s, ?& i7 N; G
//===============================================================. @8 N: q% ?2 e5 K' F1 D4 Y
日前在书上看到一段使用多项式逼近计算平方根的代码,至今都没搞明白作者是怎样推算出那个公式的。但在尝试解决问题的过程中,学到了不少东西,于是便有了这篇心得,写出来和大家共享。其中有错漏的地方,还请大家多多指教。
0 [# W* f8 o: ]" c* b6 m! t+ B的确,正如许多人所说的那样,现在有有FPU,有3DNow,有SIMD,讨论软件算法好像不合时宜。关于sqrt的话题其实早在2003年便已在 GameDev.net上得到了广泛的讨论(可见我实在非常火星了,当然不排除还有其他尚在冥王星的人,嘿嘿)。而尝试探究该话题则完全是出于本人的兴趣和好奇心(换句话说就是无知)。
" M) y; G. J( m0 }( E% V我只是个beginner,所以这种大是大非的问题我也说不清楚(在GameDev.net上也有很多类似的争论)。但无论如何,Carmack在DOOM3中还是使用了软件算法,而多知道一点数学知识对3D编程来说也只有好处没坏处。3D图形编程其实就是数学,数学,还是数学。+ E  {4 |7 o  a  s+ Y
文章原本是用HTML编排的,所以只截取了部分有比较有趣的东西放在这里。原文在我的个人主页上,同时也提供了2篇论文的下载:http://greatsorcerer.go2.icpcn.com/info/fastsqrt.html
; S+ {3 ]% P) N=========================================================( K4 w0 H) H9 c' {4 }( \/ q: Y
在3D图形编程中,经常要求平方根或平方根的倒数,例如:求向量的长度或将向量归一化。C数学函数库中的sqrt具有理想的精度,但对于3D游戏程式来说速度太慢。我们希望能够在保证足够的精度的同时,进一步提高速度。0 p, \* X( g& i; }: ~8 h
Carmack在QUAKE3中使用了下面的算法,它第一次在公众场合出现的时候,几乎震住了所有的人。据说该算法其实并不是Carmack发明的,它真正的作者是Nvidia的Gary Tarolli(未经证实)。
* T& l& R1 L2 G# A7 Y-----------------------------------
# ?* G5 }: \& i! }//
5 H& y3 R1 x. F' t2 d+ f$ m// 计算参数x的平方根的倒数
; w1 Y+ h5 q/ d0 F//# h- v, N0 j( D- B
float InvSqrt (float x): _9 V6 _1 {& ?# p0 |" L
{
* B) U) e7 A+ p$ f' Hfloat xhalf = 0.5f*x;
- U2 ~% y( Y" p6 c* bint i = *(int*)&x;
+ S$ \# R2 u) Si = 0x5f3759df - (i >> 1); // 计算第一个近似根
5 a; D" Q0 {) {; Q! gx = *(float*)&i;
; Z- m( H- j) b- j& D( F3 nx = x*(1.5f - xhalf*x*x); // 牛顿迭代法
% z7 G2 w$ S( f, Y/ c3 k: treturn x;
. I% k1 z; Z4 G; B, U}1 d5 W! ?- Q- g1 l2 v" z* \! ?7 H
----------------------------------. q  u" _6 \2 D. E0 k3 a* ]2 ]
该算法的本质其实就是牛顿迭代法(Newton-Raphson Method,简称NR),而NR的基础则是泰勒级数(Taylor Series)。NR是一种求方程的近似根的方法。首先要估计一个与方程的根比较靠近的数值,然后根据公式推算下一个更加近似的数值,不断重复直到可以获得满意的精度。其公式如下:2 f$ K) c* Z8 j6 M
-----------------------------------6 @3 x1 v. O* V* f8 T5 i
函数:y=f(x)
% d/ Y* Q0 `9 U% S其一阶导数为:y'=f'(x)6 w) D: @  \4 y, l+ s+ A8 B
则方程:f(x)=0 的第n+1个近似根为
2 D( {3 l+ i* G( qx[n+1] = x[n] - f(x[n]) / f'(x[n])
3 u4 x! _/ p+ c& x3 B% I-----------------------------------$ Z6 `9 Y2 B- v2 H6 f* \2 s
NR最关键的地方在于估计第一个近似根。如果该近似根与真根足够靠近的话,那么只需要少数几次迭代,就可以得到满意的解。9 N0 r0 m& t3 B& \6 g. b% B9 f2 n
现在回过头来看看如何利用牛顿法来解决我们的问题。求平方根的倒数,实际就是求方程1/(x^2)-a=0的解。将该方程按牛顿迭代法的公式展开为:
3 G, z& v' t3 e- n+ h8 ?x[n+1]=1/2*x[n]*(3-a*x[n]*x[n])
- z( o* g" Z1 n, n将1/2放到括号里面,就得到了上面那个函数的倒数第二行。. v: w' u! H* V  w' b$ q# J8 c: b" s
接着,我们要设法估计第一个近似根。这也是上面的函数最神奇的地方。它通过某种方法算出了一个与真根非常接近的近似根,因此它只需要使用一次迭代过程就获得了较满意的解。它是怎样做到的呢?所有的奥妙就在于这一行:
! k; P+ P8 I$ j7 U8 g1 }i = 0x5f3759df - (i >> 1); // 计算第一个近似根1 q& y5 |" n' q0 R& G& Y& @
超级莫名其妙的语句,不是吗?但仔细想一下的话,还是可以理解的。我们知道,IEEE标准下,float类型的数据在32位系统上是这样表示的(大体来说就是这样,但省略了很多细节,有兴趣可以GOOGLE):! I7 X3 T% C1 m4 F7 @
-------------------------------
! O5 O8 @, \/ G8 F# _bits:31 30 ... 0
4 {7 A& u* t( o  S31:符号位
" ^: Z. e  V- h" f30-23:共8位,保存指数(E)
4 f' \" j) t* S+ F  ]' r22-0:共23位,保存尾数(M)
5 `9 k3 \% {% u6 F-------------------------------, r+ P; Z/ m9 m" Y
所以,32位的浮点数用十进制实数表示就是:M*2^E。开根然后倒数就是:M^(-1/2)*2^(-E/2)。现在就十分清晰了。语句i> >1其工作就是将指数除以2,实现2^(E/2)的部分。而前面用一个常数减去它,目的就是得到M^(1/2)同时反转所有指数的符号。
' p5 F$ k8 C/ ^4 N, Z. K: ?至于那个0x5f3759df,呃,我只能说,的确是一个超级的Magic Number。9 o" m8 n/ a" ?# h/ N, r4 H. c" |
那个Magic Number是可以推导出来的,但我并不打算在这里讨论,因为实在太繁琐了。简单来说,其原理如下:因为IEEE的浮点数中,尾数M省略了最前面的1,所以实际的尾数是1+M。如果你在大学上数学课没有打瞌睡的话,那么当你看到(1+M)^(-1/2)这样的形式时,应该会马上联想的到它的泰勒级数展开,而该展开式的第一项就是常数。下面给出简单的推导过程:! Y, B, P" k0 e) N$ `! ]: T# K
-------------------------------) s- I& n+ l# B* h) [: ]5 }- t' I, i
对于实数R>0,假设其在IEEE的浮点表示中,1 |" x0 E7 y. [" _+ f: M2 W
指数为E,尾数为M,则:. G# @9 T# U1 k4 Q- H" x% l  F
R^(-1/2)7 T( `, A0 ~+ Y" ?* ~4 k) N
= (1+M)^(-1/2) * 2^(-E/2)
) d5 A: ^" `) u! Q: i: R% j/ ]将(1+M)^(-1/2)按泰勒级数展开,取第一项,得:
1 b: U) X+ N5 y: w* d9 l& G% e原式7 o% c% _7 ]" T  p- s9 v7 c
= (1-M/2) * 2^(-E/2)
  S% d/ P$ r) |$ V= 2^(-E/2) - (M/2) * 2^(-E/2)- ^8 o: x" S9 E7 m! F- u' n
如果不考虑指数的符号的话,8 s5 P% |# S# g" i' j. o# n1 E
(M/2)*2^(E/2)正是(R>>1),) `0 R. H  V3 j7 t5 v
而在IEEE表示中,指数的符号只需简单地加上一个偏移即可,
" j" e( m+ ?% w1 u# j而式子的前半部分刚好是个常数,所以原式可以转化为:
' A* x0 Q. p% b1 z  P$ w2 H原式 = C - (M/2)*2^(E/2) = C - (R>>1),其中C为常数* v& R9 C. d. g
所以只需要解方程:
; d! j7 i5 f" A% J1 c( J: x. }, kR^(-1/2)
1 s. }$ {6 K0 p# d$ H. Q= (1+M)^(-1/2) * 2^(-E/2)
  n# g+ u; \7 {= C - (R>>1)
4 N$ M# X9 \3 t" B, \. a求出令到相对误差最小的C值就可以了# p$ L" v0 o8 U9 l1 m" C4 {6 ^, |( G
-------------------------------
) b5 n3 H( D; `2 C6 T上面的推导过程只是我个人的理解,并未得到证实。而Chris Lomont则在他的论文中详细讨论了最后那个方程的解法,并尝试在实际的机器上寻找最佳的常数C。有兴趣的朋友可以在文末找到他的论文的链接。
5 p% c% g0 P3 y# l6 W所以,所谓的Magic Number,并不是从N元宇宙的某个星系由于时空扭曲而掉到地球上的,而是几百年前就有的数学理论。只要熟悉NR和泰勒级数,你我同样有能力作出类似的优化。
- P/ z$ J% v; q, F在GameDev.net上有人做过测试,该函数的相对误差约为0.177585%,速度比C标准库的sqrt提高超过20%。如果增加一次迭代过程,相对误差可以降低到e-004 的级数,但速度也会降到和sqrt差不多。据说在DOOM3中,Carmack通过查找表进一步优化了该算法,精度近乎完美,而且速度也比原版提高了一截(正在努力弄源码,谁有发我一份)。
2 `5 H3 a+ B" D% X8 K' {1 g值得注意的是,在Chris Lomont的演算中,理论上最优秀的常数(精度最高)是0x5f37642f,并且在实际测试中,如果只使用一次迭代的话,其效果也是最好的。但奇怪的是,经过两次NR后,在该常数下解的精度将降低得非常厉害(天知道是怎么回事!)。经过实际的测试,Chris Lomont认为,最优秀的常数是0x5f375a86。如果换成64位的double版本的话,算法还是一样的,而最优常数则为0x5fe6ec85e7de30da(又一个令人冒汗的Magic Number - -b)。
8 z1 N3 C) P1 V% o: V  P6 C* \% X这个算法依赖于浮点数的内部表示和字节顺序,所以是不具移植性的。如果放到Mac上跑就会挂掉。如果想具备可移植性,还是乖乖用sqrt好了。但算法思想是通用的。大家可以尝试推算一下相应的平方根算法。. X* w/ [! t4 o1 y# F
下面给出Carmack在QUAKE3中使用的平方根算法。Carmack已经将QUAKE3的所有源代码捐给开源了,所以大家可以放心使用,不用担心会受到律师信。. b3 W  f0 W! B0 l: U
---------------------------------& U" j/ H  m8 u% T! W4 u! z
//
) W) j6 R- h+ F  k1 z0 X$ V// Carmack在QUAKE3中使用的计算平方根的函数
* E/ ]$ [. p) y//! Z5 t/ E& s5 B& Q% y# N
float CarmSqrt(float x){9 L+ o# E: Y, e- s
union{
+ F" d1 T; u1 G" jint intPart;
" O3 X, G, M: ~! u# w4 z' sfloat floatPart;7 i5 Z9 C) @3 w) x+ P& W
} convertor;
7 H. j2 `" Y  g/ t+ M! V" \9 cunion{
% @8 j" c* r; R& J  t6 Nint intPart;
* ~( h3 c- ?8 u& `8 sfloat floatPart;
' ^5 N2 A1 U. }: x: j; h} convertor2;
$ V4 ~; Q$ t8 X. J( pconvertor.floatPart = x;+ j3 N& R  [0 X" J
convertor2.floatPart = x;5 ?! E$ U0 ^7 E8 C' ]' \
convertor.intPart = 0x1FBCF800 + (convertor.intPart >> 1);) z8 R" v& Q8 i: N, ]# U, U5 `5 Z1 a
convertor2.intPart = 0x5f3759df - (convertor2.intPart >> 1);  f4 D; T  c) w8 J$ n
return 0.5f*(convertor.floatPart + (x * convertor2.floatPart));
+ m, {# [. H) Z+ r" O$ X}
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
olh2008 实名认证       

88

主题

42

听众

1万

积分

船长

  • TA的每日心情
    开心
    2018-9-1 14:36
  • 签到天数: 86 天

    [LV.6]常住居民II

    邮箱绑定达人 优秀斑竹奖 新人进步奖 发帖功臣 最具活力勋章 元老勋章 原创写作奖 风雨历程奖

    群组Latex研学群

    群组数学建模

    群组Mathematica研究小组

    群组LINGO

    群组Matlab讨论组

    // 计算参数x的平方根的倒数
    ' o- ^& k# c: d1 _9 |  V" u//& T+ _/ A) G; @; y2 U6 ?8 Z+ ]# r2 T
    float InvSqrt (float x)' n+ d7 `# t, j: G1 P; Z
    {
    - @0 x% P" B& r; gfloat xhalf = 0.5f*x;
    . L8 W1 ^' J3 S2 }2 K  ~* Zint i = *(int*)&x;
    1 E, E! k& j, V3 N6 V& ^9 ?i = 0x5f3759df - (i >> 1); // 计算第一个近似根
    0 y: v# O4 d9 A7 k" Qx = *(float*)&i;
    - f/ f" }1 ^! W& S& I) ]x = x*(1.5f - xhalf*x*x); // 牛顿迭代法* I  \9 w  n$ i- {7 ]2 d
    return x;' ?. @$ ?6 h* z5 N( _- x
    }
    ( V6 g) ^3 O4 X# Y- L
    这个函数好像并不能实现计算x的平方根的倒数,比如我输入参数为100,它得到的却是-NAN
    生命,到最后总能成诗……
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-1-1 16:40 , Processed in 0.437993 second(s), 58 queries .

    回顶部