<>分而治之方法还可以用于实现另一种完全不同的排序方法,这种排序法称为快速排序(quick sort)。在这种方法中, n 个元素被分成三段(组):左段l e f t,右段r i g h t和中段m i d d l e。中段仅包含一个元素。左段中各元素都小于等于中段元素,右段中各元素都大于等于中段元素。因此l e f t和r i g h t中的元素可以独立排序,并且不必对l e f t和r i g h t的排序结果进行合并。m i d d l e中的元素被称为支点( p i v o t )。图1 4 - 9中给出了快速排序的伪代码。- x8 f" m- g* N
$ _# R3 m& X' {( |4 O+ `1 W1 n
4 H+ k3 V' E0 @- D) N* j) h& M
/ /使用快速排序方法对a[ 0 :n- 1 ]排序6 @! {. w w. Z% P+ W1 L$ D: C
) Z: M" C- r( L& F3 V
从a[ 0 :n- 1 ]中选择一个元素作为m i d d l e,该元素为支点1 A! Y, |3 L/ `" F: C+ m2 ^ F% F7 f
/ R: U+ M2 g, U) j7 D
把余下的元素分割为两段left 和r i g h t,使得l e f t中的元素都小于等于支点,而right 中的元素都大于等于支点" V( U9 F. Z$ O; K8 Q
% h; I, u. g8 M递归地使用快速排序方法对left 进行排序0 a7 W. S; g* f/ \& \$ R
* R9 c _- O; c, p8 J
递归地使用快速排序方法对right 进行排序 5 Y7 s7 v/ }1 @- N, G9 k ? # P. c e, m# y所得结果为l e f t + m i d d l e + r i g h t 5 y& f9 [) E/ `! Y" r 1 i6 {/ b# H r; _图14-9 快速排序的伪代码+ F9 t) B& M1 y! h7 R2 K8 q
9 L; L) l" w) i/ `( D) S
) L9 @" W, u1 k" Y m4 \2 F+ C" V! ?
考察元素序列[ 4 , 8 , 3 , 7 , 1 , 5 , 6 , 2 ]。假设选择元素6作为支点,则6位于m i d d l e;4,3,1,5,2位于l e f t;8,7位于r i g h t。当left 排好序后,所得结果为1,2,3,4,5;当r i g h t排好序后,所得结果为7,8。把right 中的元素放在支点元素之后, l e f t中的元素放在支点元素之前,即可得到最终的结果[ 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 ]。 . i1 g; S9 e3 K1 S5 j# z2 @9 ]/ G5 n, T
把元素序列划分为l e f t、m i d d l e和r i g h t可以就地进行(见程序1 4 - 6)。在程序1 4 - 6中,支点总是取位置1中的元素。也可以采用其他选择方式来提高排序性能,本章稍后部分将给出这样一种选择。 * S) d; Q3 F4 _3 m7 c6 o1 @: t 7 a5 i! D9 p% b, D1 B2 U程序14-6 快速排序 * n q. b* J% V0 w. x. }. }+ e 7 x; M% C5 {3 d/ Mtemplate<CLASS T> R" I( H' `3 J. K. E
b! x* f2 @! Y1 i7 S) q; O! c( p中值快速排序( median-of-three quick sort)是程序1 4 - 6的一种变化,这种算法有更好的平均性能。注意到在程序1 4 - 6中总是选择a [ 1 ]做为支点,而在这种快速排序算法中,可以不必使用a [ 1 ]做为支点,而是取{a[1],a[(1+r)/2],a[r]} 中大小居中的那个元素作为支点。例如,假如有三个元素,大小分别为5,9,7,那么取7为支点。为了实现中值快速排序算法,一种最简单的方式就是首先选出中值元素并与a[1] 进行交换,然后利用程序1 4 - 6完成排序。如果a [ r ]是被选出的中值元素,那么将a[1] 与a[r] 进行交换,然后将a [ 1 ](即原来的a [ r ])赋值给程序1 4 - 6中的变量p i v o t,之后继续执行程序1 4 - 6中的其余代码。 , g& M6 r7 r. a( W- } 4 U& N7 B( P0 Z6 }0 F图2 - 11中分别给出了根据实验所得到的归并排序、堆排序、插入排序、快速排序的平均时间。对于每一个不同的n, 都随机产生了至少1 0 0组整数。随机整数的产生是通过反复调用s t d l i b . h库中的r a n d o m函数来实现的。如果对一组整数进行排序的时间少于1 0个时钟滴答,则继续对其他组整数进行排序,直到所用的时间不低于1 0个时钟滴答。在图2 - 11中的数据包含产生随机整数的时间。对于每一个n,在各种排序法中用于产生随机整数及其他开销的时间是相同的。因此,图2 - 11中的数据对于比较各种排序算法是很有用的。 ) Y% z# T/ h1 w1 k% x% V $ G/ _' K7 K& n( v对于足够大的n,快速排序算法要比其他算法效率更高。从图中可以看到快速排序曲线与插入排序曲线的交点横坐标比2 0略小,可通过实验来确定这个交点横坐标的精确值。可以分别用n = 1 5 , 1 6 , 1 7 , 1 8 , 1 9进行实验,以寻找精确的交点。令精确的交点横坐标为nBr e a k。当n≤nBreak 时,插入排序的平均性能最佳。当n>nBreak 时,快速排序性能最佳。当n>nBreak 时,把插入排序与快速排序组合为一个排序函数,可以提高快速排序的性能,实现方法是把程序1 4 - 6中的以下语句:- ^6 N( Y; e9 f& _- F
1 c& k" p. K! \; I5 O
if(l >= r)r e t u r n ; % {0 n; {5 }' O : T0 W0 G: G c替换为& \# P3 ~7 |; q; F, S+ v
3 @( d0 w0 Q( f8 G/ dif (r-1<NBREAK) {InsertionSort(a,l,r); return;}* o E3 d2 W, Q( h
& m/ d2 ]8 \, s8 i R2 T这里I n s e r t i o n S o r t ( a , l , r )用来对a [ 1 : r ]进行插入排序。测量修改后的快速排序算法的性能留作练习(练习2 0)。用更小的值替换n B r e a k有可能使性能进一步提高(见练习2 0)。 ) V4 G. k& f& `" U3 o! i/ C7 {3 T% Y
大多数实验表明,当n>c时(c为某一常数),在最坏情况下归并排序的性能也是最佳的。而当n≤c时,在最坏情况下插入排序的性能最佳。通过将插入排序与归并排序混合使用,可以提高归并排序的性能(练习2 1)。</P>