4 {3 X0 n& x6 c/ f$ o! U8 }为了得到更快的算法,需要简化矩阵分割和再组合这两个步骤。一种方案是使用S t r a s s e n方法得到7个小矩阵。这7个小矩阵为矩阵D, E, ., J,矩阵D到J可以通过7次矩阵乘法, 6次矩阵加法,和4次矩阵减法计算得出。前述的4个小矩阵可以由矩阵D到J通过6次矩阵加法和两次矩阵减法得出. 6 a" J7 O; C% G) U" D; g5 l9 q: R" ?4 v% I& }' Y
用上述方案来解决n= 2的矩阵乘法。将某矩阵A和B相乘得结果C,如下所示:, t5 J% v6 _0 A
5 o" D/ |. B4 D' W, x- Y5 s. F
因为n> 1,所以将A、B两矩阵分别划分为4个小矩阵,每个矩阵为1×1阶,仅包含一个元素。1×1阶矩阵的乘法为小问题,因此可以直接进行运算。利用计算D~J的公式,得:( s, s! a) e! _$ }
7 ]7 C3 j% F3 T: R' p8 X2 |1 }
D= 1(6-8)=-2 2 D( w& U3 d7 s/ m - d A6 Q4 h$ X5 iE= 4(7-5)= 8 * J9 a, j9 k3 K9 Z7 c$ ^# `" u2 Z0 I, i8 x& T2 T
F=(3 + 4)5 = 3 5 ' k% {+ f7 O6 W& ^/ w3 R1 }6 S0 V; Y6 g- F- p
G=(1 + 2)8 = 2 4! Q( o# O m' P* @# T1 ~
% Q& d. c; ?! v$ o" K5 G* L; uH=(3-1)(5 + 6)= 2 2 : o6 O7 Y, }8 H o( s6 i9 D# t' Y& @
I=(2-4)(7 + 8)=-3 0: u( G# K. C; s: E9 q
; u) I$ t/ s$ Z( M* F/ d j
J=(1 + 4)(5 + 8)= 6 5 " }' I. f+ j! L; ]9 r; ~; _ % z* x4 c4 @, k% R1 r% V; K根据以上结果可得:8 U0 A. ^+ Z) j8 ]# O
0 f" [0 e6 s7 E3 j. w' ?, ]
对于上面这个2×2的例子,使用分而治之算法需要7次乘法和1 8次加/减法运算。而直接使用公式(2 - 1),则需要8次乘法和7次加/减法。要想使分而治之算法更快一些,则一次乘法所花费的时间必须比11次加/减法的时间要长。 . ` Y$ n6 |, @( J* K, H4 G, j) S3 e9 A* I
假定S t r a s s e n矩阵分割方案仅用于n≥8的矩阵乘法,而对于n<8的矩阵乘法则直接利用公式(2 - 1)进行计算。则n= 8时,8×8矩阵相乘需要7次4×4矩阵乘法和1 8次4×4矩阵加/减法。每次矩阵乘法需花费6 4m+ 4 8a次操作,每次矩阵加法或减法需花费1 6a次操作。因此总的操作次数为7 ( 6 4m+ 4 8a) + 1 8 ( 1 6a) = 4 4 8m+ 6 2 4a。而使用直接计算方法,则需要5 1 2m+ 4 4 8a次操作。要使S t r a s s e n方法比直接计算方法快,至少要求5 1 2-4 4 8次乘法的开销比6 2 4-4 4 8次加/减法的开销大。或者说一次乘法的开销应该大于近似2 . 7 5次加/减法的开销。3 n" }8 I8 H H! s; h. \ l
9 X5 e: d8 Z G1 q1 J假定n<1 6的矩阵是一个“小”问题,S t r a s s e n的分解方案仅仅用于n≥1 6的情况,对于n<1 6的矩阵相乘,直接利用公式( 2 - 1)。则当n= 1 6时使用分而治之算法需要7 ( 5 1 2m+ 4 4 8a) +1 8 ( 6 4a) = 3 5 8 4m+ 4 2 8 8a次操作。直接计算时需要4 0 9 6m+ 3 8 4 0a次操作。若一次乘法的开销与一次加/减法的开销相同,则S t r a s s e n方法需要7 8 7 2次操作及用于问题分解的额外时间,而直接计算方法则需要7 9 3 6次操作加上程序中执行f o r循环以及其他语句所花费的时间。即使直接计算方法所需要的操作次数比St r a s s e n方法少,但由于直接计算方法需要更多的额外开销,因此它也不见得会比S t r a s s e n方法快。 w1 t1 b; ~$ }: B& u# F5 |2 @- X# {' O: H. U7 s- d3 A+ N
n 的值越大,Strassen 方法与直接计算方法所用的操作次数的差异就越大,因此对于足够大的n,Strassen 方法将更快。设t (n) 表示使用Strassen 分而治之方法所需的时间。因为大的矩阵会被递归地分割成小矩阵直到每个矩阵的大小小于或等于k(k至少为8,也许更大,具体值由计算机的性能决定). 用迭代方法计算,可得t(n) = (nl og27 )。因为l og27 ≈2 . 8 1,所以与直接计算方法的复杂性(n3 )相比,分而治之矩阵乘法算法有较大的改进。 % w5 n9 j, J% p5 E# r t$ O+ P/ m& `2 U* u" w
注意事项1 ^' @+ B5 y8 T0 y+ Q) i
9 e& j4 u2 J4 t0 Q8 Z分而治之方法很自然地导致了递归算法的使用。在许多例子里,这些递归算法在递归程序中得到了很好的运用。实际上,在许多情况下,所有为了得到一个非递归程序的企图都会导致采用一个模拟递归栈。不过在有些情况下,不使用这样的递归栈而采用一个非递归程序来完成分而治之算法也是可能的,并且在这种方式下,程序得到结果的速度会比递归方式更快。解决金块问题的分而治之算法(例2 - 2)和归并排序方法( 2 . 3节)就可以不利用递归而通过一个非递归程序来更快地完成。 7 M' e0 |# P( u2 i5 I6 L: f0 s( p* Z. _: b6 F* y# E
例2-4 [金块问题] 用例2 - 2的算法寻找8个金块中最轻和最重金块的工作可以用二叉树来表示。这棵树的叶子分别表示8个金块(a, b,., h),每个阴影节点表示一个包含其子树中所有叶子的问题。因此,根节点A表示寻找8个金块中最轻、最重金块的问题,而节点B表示找出a,b,c 和d 这4个金块中最轻和最重金块的问题。算法从根节点开始。由根节点表示的8金块问题被划分成由节点B和C所表示的两个4金块问题。在B节点,4金块问题被划分成由D和E所表示的2金块问题。可通过比较金块a 和b 哪一个较重来解决D节点所表示的2金块问题。在解决了D和E所表示的问题之后,可以通过比较D和E中所找到的轻金块和重金块来解决B表示的问题。接着在F,G和C上重复这一过程,最后解决问题A。- k: ]& B( j. `8 k1 j5 i$ p, k
/ T4 h0 E0 }% `; W5 B可以将递归的分而治之算法划分成以下的步骤: 7 Q# n" h, ~2 v! F4 ~- n3 \. {) {' V2 }
1) 从图2 - 2中的二叉树由根至叶的过程中把一个大问题划分成许多个小问题,小问题的大小为1或2。* i% F ^& k6 N+ l- W! |6 h7 L
/ M4 E, W; u. w7 v% O9 s# i' h
2) 比较每个大小为2的问题中的金块,确定哪一个较重和哪一个较轻。在节点D、E、F和G上完成这种比较。大小为1的问题中只有一个金块,它既是最轻的金块也是最重的金块。. S: h, b2 z% [1 j. y& f5 p
6 K4 U! E- @0 J8 X) q3) 对较轻的金块进行比较以确定哪一个金块最轻,对较重的金块进行比较以确定哪一个金块最重。对于节点A到C执行这种比较。% R0 l. c+ D5 q7 D" z" f9 t7 i' S
9 b7 A' [# ^( @$ d
根据上述步骤,可以得出程序1 4 - 1的非递归代码。该程序用于寻找到数组w [ 0 : n - 1 ]中的最小数和最大数,若n < 1,则程序返回f a l s e,否则返回t r u e。 3 n* E; a9 m: C G) L/ K% `8 P3 w7 b& X, s
当n≥1时,程序1 4 - 1给M i n和M a x置初值以使w [ M i n ]是最小的重量,w [ M a x ]为最大的重量。 ! |4 V) h1 B7 E( M' q, d5 M- l( ~ 6 c/ _1 q5 }( n9 H首先处理n≤1的情况。若n>1且为奇数,第一个重量w [ 0 ]将成为最小值和最大值的候选值,因此将有偶数个重量值w [ 1 : n - 1 ]参与f o r循环。当n 是偶数时,首先将两个重量值放在for 循环外进行比较,较小和较大的重量值分别置为Min和Max,因此也有偶数个重量值w[2:n-1]参与for循环。" {# g& i0 ?0 U2 a1 H+ z
8 R; C( v5 q/ z$ \% r3 a
在for 循环中,外层if 通过比较确定( w [ i ] , w [ i + 1 ] )中的较大和较小者。此工作与前面提到的分而治之算法步骤中的2) 相对应,而内层的i f负责找出较小重量值和较大重量值中的最小值和/ u! E" F, H* k( [( j
3 s7 k) }$ y. U& q& _
最大值,这个工作对应于3 )。for 循环将每一对重量值中较小值和较大值分别与当前的最小值w [ M i n ]和最大值w [ M a x ]进行比较,根据比较结果来修改M i n和M a x(如果必要)。 : g4 x; u& i; c/ v N p l3 f3 z! o2 ]7 S
下面进行复杂性分析。注意到当n为偶数时,在for 循环外部将执行一次比较而在f o r循环内部执行3 ( n / 2 - 1 )次比较,比较的总次数为3 n / 2 - 2。当n 为奇数时,f o r循环外部没有执行比较,而内部执行了3(n-1)/2次比较。因此无论n 为奇数或偶数,当n>0时,比较的总次数为「3n/2ù-2次。 2 k7 P. Z/ R- E3 i; h+ I* ? ?* H/ G
程序14-1 找出最小值和最大值的非递归程序- L0 y0 a0 R! F8 A# d) ]& J