/ P+ i; z9 B1 h5 B& g6 v用上述方案来解决n= 2的矩阵乘法。将某矩阵A和B相乘得结果C,如下所示:6 z4 F G R% M4 n# ]* U8 U
4 E) c& P' m/ C' [
因为n> 1,所以将A、B两矩阵分别划分为4个小矩阵,每个矩阵为1×1阶,仅包含一个元素。1×1阶矩阵的乘法为小问题,因此可以直接进行运算。利用计算D~J的公式,得:6 n" s/ {' S: G, }9 k4 W
. q3 Q: I# P0 V3 P
D= 1(6-8)=-2% s# Y) w1 C& v% x
) S) O3 O4 |2 @4 ]0 l( ?' a
E= 4(7-5)= 8 2 X7 I) T- L, V& S6 u# r* L7 \7 x- A
F=(3 + 4)5 = 3 5 * U3 F3 q) R) Q' K* Y! v8 f' j" L
G=(1 + 2)8 = 2 41 A; }* |- M# _: a
' K7 c1 k# `' {! h
H=(3-1)(5 + 6)= 2 2 1 r$ x1 l' x2 i# o8 H. t6 r( {9 f( _2 u" E
I=(2-4)(7 + 8)=-3 03 T0 B% e" b$ U: e9 c) B
8 L( y# Z4 g# [# I! s) eJ=(1 + 4)(5 + 8)= 6 5( B. y0 `5 n6 d
9 C# m* J j- N! m" [' s
根据以上结果可得:6 ^! Y# t, x. T$ h8 o/ C" m
. w' e! J$ p$ t2 e对于上面这个2×2的例子,使用分而治之算法需要7次乘法和1 8次加/减法运算。而直接使用公式(2 - 1),则需要8次乘法和7次加/减法。要想使分而治之算法更快一些,则一次乘法所花费的时间必须比11次加/减法的时间要长。 # h# {5 k% x* M, p$ G: Q$ ^2 j" h' ~+ z
假定S t r a s s e n矩阵分割方案仅用于n≥8的矩阵乘法,而对于n<8的矩阵乘法则直接利用公式(2 - 1)进行计算。则n= 8时,8×8矩阵相乘需要7次4×4矩阵乘法和1 8次4×4矩阵加/减法。每次矩阵乘法需花费6 4m+ 4 8a次操作,每次矩阵加法或减法需花费1 6a次操作。因此总的操作次数为7 ( 6 4m+ 4 8a) + 1 8 ( 1 6a) = 4 4 8m+ 6 2 4a。而使用直接计算方法,则需要5 1 2m+ 4 4 8a次操作。要使S t r a s s e n方法比直接计算方法快,至少要求5 1 2-4 4 8次乘法的开销比6 2 4-4 4 8次加/减法的开销大。或者说一次乘法的开销应该大于近似2 . 7 5次加/减法的开销。; ?& D3 r) y8 j. o
2 ?) I, y& Z9 |- P/ A假定n<1 6的矩阵是一个“小”问题,S t r a s s e n的分解方案仅仅用于n≥1 6的情况,对于n<1 6的矩阵相乘,直接利用公式( 2 - 1)。则当n= 1 6时使用分而治之算法需要7 ( 5 1 2m+ 4 4 8a) +1 8 ( 6 4a) = 3 5 8 4m+ 4 2 8 8a次操作。直接计算时需要4 0 9 6m+ 3 8 4 0a次操作。若一次乘法的开销与一次加/减法的开销相同,则S t r a s s e n方法需要7 8 7 2次操作及用于问题分解的额外时间,而直接计算方法则需要7 9 3 6次操作加上程序中执行f o r循环以及其他语句所花费的时间。即使直接计算方法所需要的操作次数比St r a s s e n方法少,但由于直接计算方法需要更多的额外开销,因此它也不见得会比S t r a s s e n方法快。% J& u# F' K5 g8 U2 i( i m
9 g5 K+ q, H3 a6 z0 g; `8 F8 |+ W$ P
n 的值越大,Strassen 方法与直接计算方法所用的操作次数的差异就越大,因此对于足够大的n,Strassen 方法将更快。设t (n) 表示使用Strassen 分而治之方法所需的时间。因为大的矩阵会被递归地分割成小矩阵直到每个矩阵的大小小于或等于k(k至少为8,也许更大,具体值由计算机的性能决定). 用迭代方法计算,可得t(n) = (nl og27 )。因为l og27 ≈2 . 8 1,所以与直接计算方法的复杂性(n3 )相比,分而治之矩阵乘法算法有较大的改进。 3 J) g/ J7 x% a $ p+ k9 s2 L# {/ m! h注意事项 0 E; |/ n: s' h( q4 s* W5 I+ v; Z& B! o. w( e9 ?$ f, G
分而治之方法很自然地导致了递归算法的使用。在许多例子里,这些递归算法在递归程序中得到了很好的运用。实际上,在许多情况下,所有为了得到一个非递归程序的企图都会导致采用一个模拟递归栈。不过在有些情况下,不使用这样的递归栈而采用一个非递归程序来完成分而治之算法也是可能的,并且在这种方式下,程序得到结果的速度会比递归方式更快。解决金块问题的分而治之算法(例2 - 2)和归并排序方法( 2 . 3节)就可以不利用递归而通过一个非递归程序来更快地完成。 . A% S; v1 c4 e5 v3 e) ^( i % N1 `% F# D% p' R例2-4 [金块问题] 用例2 - 2的算法寻找8个金块中最轻和最重金块的工作可以用二叉树来表示。这棵树的叶子分别表示8个金块(a, b,., h),每个阴影节点表示一个包含其子树中所有叶子的问题。因此,根节点A表示寻找8个金块中最轻、最重金块的问题,而节点B表示找出a,b,c 和d 这4个金块中最轻和最重金块的问题。算法从根节点开始。由根节点表示的8金块问题被划分成由节点B和C所表示的两个4金块问题。在B节点,4金块问题被划分成由D和E所表示的2金块问题。可通过比较金块a 和b 哪一个较重来解决D节点所表示的2金块问题。在解决了D和E所表示的问题之后,可以通过比较D和E中所找到的轻金块和重金块来解决B表示的问题。接着在F,G和C上重复这一过程,最后解决问题A。* O5 H/ e3 U5 v
) U1 N/ @$ K( z/ s! z可以将递归的分而治之算法划分成以下的步骤:' X+ q3 H! z$ @
* t& V& L& c) V% Z# v& b
1) 从图2 - 2中的二叉树由根至叶的过程中把一个大问题划分成许多个小问题,小问题的大小为1或2。4 u3 V* i1 s: g# H
, Q2 E, J8 J/ ^- Y9 u$ ~
2) 比较每个大小为2的问题中的金块,确定哪一个较重和哪一个较轻。在节点D、E、F和G上完成这种比较。大小为1的问题中只有一个金块,它既是最轻的金块也是最重的金块。7 i2 P0 q5 U- L; I7 [6 j/ {
" O! f" K* Z# O4 o! N e
3) 对较轻的金块进行比较以确定哪一个金块最轻,对较重的金块进行比较以确定哪一个金块最重。对于节点A到C执行这种比较。% d2 N4 Y$ A4 M/ o
Q( V/ x+ k" b a2 U0 K4 i1 T
根据上述步骤,可以得出程序1 4 - 1的非递归代码。该程序用于寻找到数组w [ 0 : n - 1 ]中的最小数和最大数,若n < 1,则程序返回f a l s e,否则返回t r u e。 ' z0 ^& }5 \* h8 u# O4 M' @, N5 w8 G9 S
当n≥1时,程序1 4 - 1给M i n和M a x置初值以使w [ M i n ]是最小的重量,w [ M a x ]为最大的重量。8 l' a$ _ }( z9 h$ {! e
/ D V1 P$ S3 T: o* ?* I首先处理n≤1的情况。若n>1且为奇数,第一个重量w [ 0 ]将成为最小值和最大值的候选值,因此将有偶数个重量值w [ 1 : n - 1 ]参与f o r循环。当n 是偶数时,首先将两个重量值放在for 循环外进行比较,较小和较大的重量值分别置为Min和Max,因此也有偶数个重量值w[2:n-1]参与for循环。; K D) N: Q+ t+ [
+ Z7 d5 X# x0 y/ ]在for 循环中,外层if 通过比较确定( w [ i ] , w [ i + 1 ] )中的较大和较小者。此工作与前面提到的分而治之算法步骤中的2) 相对应,而内层的i f负责找出较小重量值和较大重量值中的最小值和 " o: ^4 z6 v& a% ?* I" E6 b9 v7 O# c/ C5 ?# ^$ R. k7 l
最大值,这个工作对应于3 )。for 循环将每一对重量值中较小值和较大值分别与当前的最小值w [ M i n ]和最大值w [ M a x ]进行比较,根据比较结果来修改M i n和M a x(如果必要)。 # Z) y+ [) S% }. G2 @! q% k5 C* [0 G8 K7 d* Y( N
下面进行复杂性分析。注意到当n为偶数时,在for 循环外部将执行一次比较而在f o r循环内部执行3 ( n / 2 - 1 )次比较,比较的总次数为3 n / 2 - 2。当n 为奇数时,f o r循环外部没有执行比较,而内部执行了3(n-1)/2次比较。因此无论n 为奇数或偶数,当n>0时,比较的总次数为「3n/2ù-2次。 s& b$ O* ?8 y& e: r/ h 0 y. N8 P# D2 U程序14-1 找出最小值和最大值的非递归程序$ }# p! X. y# t ]' l8 p
/ e W! K6 ^) m1 l: O, Rtemplate<CLASS T>; n1 S& M4 ^/ i0 F# N
4 B& z# b; _& y6 F. i8 v$ Q1 s
bool MinMax(T w[], int n, T& Min, T& Max) 0 K: f) P, w& `$ h' x: n' s: s# b6 F) h! L$ o
{// 寻找w [ 0 : n - 1 ]中的最小和最大值& M! B- G- q; \+ g' m0 c% A
+ {8 }+ M9 O/ i& }5 u- \// 如果少于一个元素,则返回f a l s e ) W% Z; L3 y# p7 q" r2 o& E9 e9 B- P) y4 m3 p
// 特殊情形: n <= 14 \9 c$ ]* p, s1 f8 [
' K% q+ E/ A! ]
if (n < 1) return false; $ C+ G% n7 h# v# N+ l' P! \2 _9 o4 Y2 h( S+ s1 A3 c- W: j
if (n == 1) {Min = Max = 0; " |0 z7 |& _' l' U2 X; w2 }6 b/ | 4 k/ ]+ R# p& I2 Wreturn true;} + [% T; ^" i; j, B2 y; |6 a! Z' H. z T
/ /对Min 和M a x进行初始化& v' Y% f5 ?* }
# e4 V5 R* P1 \* Iint s; // 循环起点 * s8 ]! Q6 V8 U% r" R4 w' R' N# b# t5 `9 X# ~/ \& C9 e: k
if (n % 2) {// n 为奇数3 \% S9 l: @/ _/ Z
/ t* R! F* Y" [$ F. W
Min = Max = 0;/ _2 P: l% p1 r: L& f4 ]7 w* Z
( c4 G- L6 C6 @% |: t; G
s = 1;} ' z4 q z2 t4 O2 X1 D9 @4 I; r2 X" \1 o* s! w. m, c
else {// n为偶数,比较第一对 2 m) }: w3 g" U+ O% z) i 4 m Z# [4 A# K. n' O2 xif (w[0] > w[1]) { 4 @; @7 k; U! t7 Z3 Q- R 5 y; |4 D, \+ C' L, tMin = 1;! X/ M6 ^7 ]) R4 X/ `% I+ n
7 {, b8 d8 V$ y& bMax = 0;} 1 O4 o' k( T* F! y! p4 G6 W" B / `! I0 {3 D. h* Z; r# @else {Min = 0;9 w" ]! K- s9 [# x0 y. e% V
* @, e- }, p7 c6 z- a$ ZMax = 1;}8 \! i( x$ b) p
3 c- o: q) T/ X* {; _. T
s = 2;} ; }; g1 q) V, ]# E3 X, r" c 2 n2 O" j; p$ ^4 K* o& w5 I% w! p5 d// 比较余下的数对2 N5 d3 O3 e% A8 ]1 D
7 R! W7 R1 j, B9 D% F! }for (int i = s; i < n; i += 2) {4 m& W' e+ r. H' v1 Z/ \: T) v3 r" h# N
, j0 J$ t4 q4 W {& g
// 寻找w 和w [ i + 1 ]中的较大者 " m# i: u) G2 O0 H$ s / h: Z- T7 P1 u( U) {// 然后将较大者与w [ M a x ]进行比较* ~) F3 j5 J; _2 P1 D+ H% w
7 c0 m, h0 ?/ F7 x: n, i
// 将较小者与w [ M i n ]进行比较 + {( {/ [: k/ y' U1 f3 J 3 P3 S6 d2 I- {: f7 J) R" @+ uif (w > w[i+1]) { 1 L, v7 |- B5 s, \7 ?- z: A- |- q8 x8 m6 c Q) v' l
if (w > w[Max]) Max = i; # B# L2 Y; R6 y( O2 R) l. P0 C9 f j* r
if (w[i+1] < w[Min]) Min = i + 1;}" T- J- Z7 u9 i) z
; k# G: ^) v- T# v" j% kelse { 2 L6 k1 ^9 k+ C ' O! w# R( w9 i- w, Sif (w[i+1] > w[Max]) Max = i + 1; l) B; ^' y& K7 |5 l
; r1 T- }' c* u7 j, B6 u8 I E, Q
if (w < w[Min]) Min = i;} : m2 f0 ~8 Q5 Q 4 G) g' H: B3 K+ f8 L: Z} @. [. `% Q3 f4 Q& l0 x! y ! h1 n* T' e$ Q: p7 breturn true; $ N6 t! q: Y% e8 M% |# C 7 z( ?! s& J8 ^0 ]+ t} & i# X1 L, z f" M/ c: A 7 i6 R: h0 E' y) k; D练习3 k' h7 @) R" o: }6 h# g, c
- J* `4 ~$ h" ]( |- F! c4) 注意到如果比较操作的开销不是很高,分而治之算法在最坏情况下不会比其他算法优越,为什么?它的平均时间优于程序2 - 2 7吗?为什么? % C. a3 J# O$ {2 E. _ 8 A! X* Q& V8 `1 H {/ ^6 c$ n3 Q4 Q4. 证明直接运用公式(1 4 -2)~(1 4 - 5)得出结果的矩阵乘法的分而治之算法的复杂性为(n3 )。因此相应的分而治之程序将比程序2 - 2 4要慢。 Z7 U, J* }6 @ D `6 F: W! j: ] 4 {1 e& h- {3 C+ Y9 F" y5. 用迭代的方法来证明公式(1 4 - 6)的递归值为(n l og27)。 " g+ |( S5 P: ^. Y1 M& i3 T k/ L4 X9 S6 q
*6. 编写S t r a s s e n矩阵乘法程序。利用不同的k 值(见公式(1 4 - 6))进行实验,以确定k 为何值时程序性能最佳。比较程序及程序2 - 2 4的运行时间。可取n 为2的幂来进行比较。 ' {0 t% \/ g" |& t' J8 m0 q. I. r2 @* K" X# ^; Y9 a& W! ]
7. 当n 不是2的幂时,可以通过增加矩阵的行和列来得到一个大小为2的幂的矩阵。假设使用最少的行数和列数将矩阵扩充为m 阶矩阵,其中m 为2的幂。- P! \+ D/ \/ b( R
5 [9 g1 S9 B3 Y7 A1) 求m / n。 b- F9 N; G! a' o % N' s, B1 \" ^( p: C5 Q, \8 T3 p2) 可使用哪些矩阵项组成新的行和列,以使新矩阵A' 和B' 相乘时,原来的矩阵A和B相乘的结果会出现在C' 的左上角? 1 o( r& T- _$ o' N& S/ Z2 B3 a$ M/ w9 R3 @2 A9 D& n0 W
3) 使用S t r a s s e n方法计算A' * B' 所需要的时间为(m2.81 )。给出以n 为变量的运行时间表达式。 </P>