数学建模社区-数学中国
标题:
常见的十种排序算法C++实现(附时空复杂度,稳定性分析)
[打印本页]
作者:
杨利霞
时间:
2022-9-8 09:57
标题:
常见的十种排序算法C++实现(附时空复杂度,稳定性分析)
常见的十种排序算法C++实现(附时空复杂度,稳定性分析)
: R) A2 ]$ e1 O; U( ^
: t& d# S& L& i ~! H
一、冒泡排序
) ~: t* t2 P J# b9 B
思路:每一轮排序使得当前无序的部分的最大值冒到当前无序数组的末尾,下一轮中无序部分的长度等于上一轮减一,原数组的末端不断的变成有序的部分。
4 o0 P* J l) h& b5 H
/ g2 k+ i9 d5 r7 I* s/ K- |& ]+ y
void bubble_sort(vector<int> &nums)
/ E4 w1 @/ C0 v/ c: N- M7 W
{
5 K r5 A; R& ~6 |$ s+ a
// 用于标记当前轮是否有交换发生
8 Q: W5 I" C# n% E8 X: \5 d1 ?+ {
bool swaped;
5 i7 U. K8 g$ I3 a* Q. n% b G+ ^
// 从第一个数到倒数第二个数(n个数需要冒泡n-1次)
/ f J) d" C7 W0 Z$ b# j
for(int i = 0; i < nums.size() - 1; ++i)
. F8 z2 |+ R2 p2 o) p- x6 g
{
& x& W4 q, K- Y0 k3 ~& y* H! o8 {
swaped = false;
+ _' g- h6 ^( e' @
// 因为是当前的和后面的比,所以结束条件是一直到冒泡完毕的元素的前一个
. K4 Z2 U& c# b1 p, y) o) G
for (int j = 0; j < nums.size()-1-i; ++j)
) N3 b" |& k @/ I/ ]
{
8 _5 \; e% [) m# Q/ v4 W
// 通过交换两个元素,使得最大的冒到数组的末尾去,并且标记交换过
1 [6 N' J4 ^* h6 A0 u% ?
// 若要从大到小排序,只需要把这个 '>' 改成 '<' 即可
* b! D1 x9 Y4 j5 d! A
if (nums[j] > nums[j+1])
6 z/ T* m( {; x0 L7 B9 U
{
1 V3 ?4 S. y. L8 X9 u
int tmp = nums[j];
* b7 V, @2 g. O( g$ @
nums[j] = nums[j+1];
3 f9 Y3 u6 ?. S1 }% i
nums[j+1] = tmp;
! }2 p4 t+ ]/ _; @! _. ?& N
swaped = true;
" j9 Q( F6 k! |$ @/ y! S |
}
7 W8 w" K4 Z0 p2 C5 L" u) c. D- z* B
}
9 Q( D& u ]3 w( {9 j, ]
// 若该轮没有交换发生,说明数组已经有序,跳出循环
% ?! v3 a1 \" D
if (!swaped)
* {8 s0 m3 _0 @9 r2 V4 @ [. b* p& R
break;
0 r9 i$ S$ S: Z
}
% e+ s$ [9 h4 I- C7 j$ _
}
9 C" I3 |, r2 H6 ^7 s7 Z
; y: ~1 s* w" p. H) o
分析:时间复杂度最坏和平均情况是O(),最好的情况是已经有序所以是O(n),空间复杂度O(1),且因为两个相同的元素是不会交换位置的,因此是一种稳定的排序。
+ p5 I) ?! E" G- x6 t
4 f1 {% i" Y" p/ i8 V0 m
二、选择排序
* H% U! Q/ m7 o. i. ~
思路:每一轮都将未排序数组中最小的/最大的选择出来,然后与未排序数组的第一个交换。接着未排序数组的长度就应该减一,然后继续做这个操作,直到未排序数组的长度为1
/ L" v$ j7 [4 U9 l2 `
' [/ t1 U4 e: {+ A$ Y/ ^
void select_sort(vector<int> &nums)
& t$ G J! p f, Y
{
6 p$ C! U% W" \ V
// 用于存储每一轮中最小的数的下标
% n6 f' f" M9 X0 Q5 S0 i
int min_idx;
8 L1 z) D3 Z% U; ^- V
// 循环从第一个数开始到倒数第二个数
6 i% b0 t) Q1 n7 v1 {
for(int i = 0; i < nums.size() - 1; ++i)
6 h7 L* d% R' Q( O4 `# c
{
5 q' }2 \- ~' }
min_idx = i;
8 B* N* \1 U, M
// 在未排序部分寻找最小的数
, m5 [ w/ c6 O& j3 r
for (int j = i+1; j < nums.size(); ++j)
2 f K( J \, \3 t" n% u2 q
{
: B2 _! `# S r: c
// 这里将 '<' 换成 '>' 就可以从大到小排序
2 t1 I- {& C# Q& L& j2 y& r
if (nums[j] < nums[min_idx])
1 p3 c+ |: h7 ]: r
min_idx = j;
% l, a, {, h5 d8 \$ ~/ s
}
c6 U; x3 Z+ ?4 \$ u' D: B* S5 H
// 将未排序部分最小的数与未排序部分的第一数交换位置
* s3 {+ c! T' J& D9 b
int tmp = nums[min_idx];
" I7 T/ b% L \4 r& L+ J
nums[min_idx] = nums
;
' h2 i$ ]( t/ ^1 T+ a
nums
= tmp;
) v: @/ Y' P9 [% e$ x' M
}
+ n7 Q5 k1 R/ f
}
$ w' N6 H' r1 N4 Y
1 T4 Q- s8 f0 L E
分析:时间复杂度最坏、最好和平均情况都是O(),空间复杂度O(1)。因为每次选择最小元素要与未排序部分的第一个元素进行交换,因此可能会出现两个相同元素相对位置发生改变的情况,因此者是一种不稳定的排序。
3 Y2 l# h3 u) J& g8 N
2 Y' s: E! S. r3 }, t: q
三、插入排序
# y5 t) @3 Z2 V2 s/ A, n, e
思路:从第二个元素作为当前位置,往前看,判断前面的元素是否大于当前位置,是的话就把前面的元素往后移动一个,依次类推,直到到了数组头或者碰到一个元素比当前元素小则循环终止,此时的位置就应该是当前位置元素的排序合适的位置。接着向后移动,把第三个元素作为当前位置,一直到最后一个元素。
5 f8 L; L z- c0 ^ y+ K
5 ^6 t5 a8 ?- ^, ^9 ~( G3 @
void insert_sort(vector<int> &nums)
4 c9 B) K+ j* V% o/ y. R' s1 x
{
5 ~ t1 x) B' E0 H6 L2 O k
// 从第二个元素到最后一个元素
1 D5 V9 a7 R* P8 ^" o' Q4 W. N
for(int i = 1; i < nums.size(); ++i)
( E) l) B. M, ?
{
' ?9 t0 x) u M* N K) y) S% o
// tmp存下当前元素的值,将i赋给j
# s# I, M7 \0 E1 _9 i& Y
int tmp = nums
;
% t2 b0 T+ r3 W# o, D7 o3 q& M
int j = i;
3 T* o0 t; t& P) A, L$ T0 E, d
// j从当前元素往前找,一直找到第二个元素位置
+ C1 G9 A |5 E" |3 T
for (; j > 0; j--)
4 v& H" [9 F% {9 o; U8 _9 J
{
H0 I2 K/ A8 c2 Z$ q- e
// 判断tmp是否小于j-1位置的元素,是的话j-1的元素往后移动
4 H- O M3 H+ d& B* y$ e
// 要从大到小排序,只需要把 '<' 改为 '>' 即可
! Y7 B5 m2 v" g) O9 L+ V
if (tmp < nums[j-1])
1 s& f3 ^/ B l1 T2 j% w
nums[j] = nums[j-1];
$ p! Y! ^- Z9 z0 q! k3 q. j/ B' i" d/ y! G
// 否的话,j位置就应该是tmp的最终合适的位置
' d! [0 E4 R$ f# V& O
else
. |& p4 w+ H/ D2 T
break;
w7 x. M" \6 E8 w
}
% {( \! e. v) {% F6 t0 o' k
// 将tmp赋给j位置的元素
2 W" o# @8 ]! K& g
nums[j] = tmp;
9 ?9 K; ~* f; `( X/ D& _ K4 F
}
- q6 y; A. K7 Q3 X; ]9 p0 J
}
+ Y$ Y5 ~) Z- V3 m
' S) j1 k! c% X G/ o4 F+ L
分析: 时间复杂度最坏和平均情况都是O(),最好的情况是O(n)(最好情况就是已经有序,因此内层循环只需要判断一次就可以break),空间复杂度O(1)。因为是依次往前找的,元素移动也是相邻位置的移动,因此这个方法是稳定的。
; W- g2 X1 S- C# Y6 Y, B
4 W$ O$ n3 b5 P4 y
四、希尔排序
0 D# E$ Z; F7 b* \% d
思路:希尔排序是插入排序的一种扩展,它不是一个的找然后插入。而是将与原数组根据间隔分成不同的组,比如十个数{1,2,3,4,5,6,7,8,9,10}可以设置gap为2,这样就分成了{1, 3, 5, 7, 9}和{2, 4, 6, 8, 10}两个组,分的组数就等于gap的数量,每组的包含的元素数量就等于数组的长度除以gap。通过这样操作,再最后gap为1的时候,数组就是基本有序的了,因此这时只需要很少的操作就可以将整个数组变为有序的。希尔排序gap的设置很关键,设置一组好的gap序列往往可以很大程度上提高希尔排序的效率
# q. X# T! ^; V& H# @/ {
0 K+ o: u9 U* G& K, I
void shell_sort(vector<int> &nums)
$ x: a8 `% ]" a4 q; j9 t: ]3 H0 Z
{
$ O3 |( G1 R5 [- C2 R( T" h
// 初始将gap设置为数组长度的一半,每次gap等于上次gap的一半,一直循环一直到gap等于1
* s; ?- j& i' R! v
for(int gap = nums.size()/2; gap > 0; gap/=2)
2 e$ M3 H& C: @: q( y K
{
& s+ c$ A' R Y2 k, Y
// 每一组的元素数量
5 b" X* F6 C2 y4 f, ]/ D a, C. N
int ele_sz = nums.size() / gap;
& V, g" W7 H0 Z1 H, L+ c+ v
// 遍历每一组
: a) {, p* U# G0 r( |: N/ ]
for (int i = 0; i < gap; ++i)
0 k8 e+ H" w& E9 k$ O
{
- C7 P( P9 O2 | F, w
// 对每一个组进行插入排序,下面的代码和插入排序那基本一样
t/ i4 m: Z0 s5 W
for (int j = 1; j < ele_sz; ++j)
6 h A" _) d k; }9 }9 r* {! }
{
9 m: t& x- x* ] u2 Z: h+ j
int tmp = nums[j*gap];
- H9 F h7 \# {
int k = j;
. i2 g a0 |- A) X/ J
for (; k > 0; --k)
* Z* S2 i1 b" t! a% z# G+ Q
{
6 `5 g; e% }% A. J# I; b
// 注意这里的下标要符合希尔排序间隔\
# h& E) I1 ~9 t( B& X' `/ [1 p
// 要从大到小排序,只需要把 '<' 改为 '>' 即可
* \" ]5 f0 a7 U% c: c$ U4 R2 \; F- w
if (tmp < nums[(k-1)*gap])
+ q, s N/ c" @4 |+ u
nums[k*gap] = nums[(k-1)*gap];
1 f+ k, _6 D3 Q' Z! a/ \. {
else
- @" L) Y! @5 u& y6 @/ W7 r# D
break;
7 c' Y( i8 e& t* `6 t0 B
}
+ G6 F! T& a# O0 Y) T4 P
// 找到了最终插入的位置
2 ^ R: t/ b$ `# R U. |$ G. X
nums[k*gap] = tmp;
: q: O! a( s1 U" C+ z# J f
}
, z2 ~$ J/ l9 |1 `- c$ N U
}
) H* Y8 X, _* s/ F% D2 w
// 因为每次gap等于上次一半,当gap为1的时候就陷入死循环,所以这里设置一个判断用于跳出
. K6 h6 H. H8 K1 D3 F
if (gap == 1)
3 O% g7 y$ }# j; [- {' n" w8 t
break;
9 X8 S/ m* I% G/ Q) R3 g8 ?- w
}
( S/ c, u8 j' X/ y( ` h
}
; o4 }# S3 \' f- T' s
" S! o# h5 M) a0 u0 A
分析:希尔排序最好情况的时间复杂度为O(nlogn),而最坏情况和平均情况要根据它的增量序列来确定,好的增量序列可以把最坏情况的时间复杂度控制为O()。希尔排序是原地排序因此空间复杂度为O(1)。由于增量序列的存在,使得比较的元素存在间隔,因此就可能导致相同元素的相对位置发生改变,因此希尔排序是不稳定的。
, B! q0 o5 d9 F2 M3 c: {, m
\# L" e0 Q* N. b4 H+ S3 f- a+ S9 A
五、归并排序
' z* x3 g% G7 X& N
思路:归并排序是分治法的典型应用之一。首先先把大的数组拆分成两半,再继续拆,直到只剩一个数位置,拆完之后要合并,合并的时候就需要对两边的数进行排序,合并完成的时候就变成了有序的数组。以此类推,对左边的已经有序和右边已经有序的数组进行合并,最终得到了整体有序的数组。
0 X% H. \- d: b, b% L6 W
" ?2 F! k0 e- T# Z& O8 Z
// 合的过程
& @: w& a% _ W, P8 }' Q* Q( T5 x
vector<int> merge_vec(vector<int> ivec1, vector<int> ivec2)
& n' w8 F! L; {6 h$ \! k
{
% x' N# r0 {9 U3 w! n% F4 B; m
// 定义结果数组res, i和j分别用于遍历ivec1和ivec2
: W4 R/ W; n; ?) X6 s' S' _
vector<int> res;
3 U$ H( G' W* Y) z6 \2 T' I7 f0 Q: t
int i = 0, j = 0;
, V7 o* Z* ]% N) J1 E1 A* m
// 当两个数组都没遍历到底
2 H4 z3 u8 V+ r2 {; d% v5 }( n
while(i < ivec1.size() && j < ivec2.size())
7 T+ c% d% O. v7 R
{
0 F+ v& [$ @ Y0 h- P9 G3 q
// 谁的当前数字小,谁就加入结果数组,并且下标后移
K+ n. r& ^ m# m; G. @
// 这里将 '<' 改为 '>' 就可以从大到小排序
# V& a5 k3 k# g3 {7 N
if (ivec1
< ivec2[j])
2 l0 B: ]" _( e( I6 P
res.push_back(ivec1[i++]);
3 p6 K3 {: a3 _) G. t
else
) _# i% z7 Y" O2 X* d8 d, H
res.push_back(ivec2[j++]);
1 m/ B) b; \, e: T+ t" \% [
}
3 Y3 d' p' V% Z% t5 A$ T
// 处理未遍历完的数组,直接全部加入最后面
' f' z0 Y9 ~+ ]* V' w
while (j < ivec2.size())
2 d I5 G! q* i+ Z4 a
res.push_back(ivec2[j++]);
; ]& o# C; f, H
while (i < ivec1.size())
! L8 {$ C4 b. L' x
res.push_back(ivec1[i++]);
% F/ q6 L$ D. E: v# q
// 返回合并好的数组
0 x! `& O2 X F+ l
return res;
1 P/ E; f4 S' F9 u7 K7 E
}
8 A2 \" w' P4 K v2 a
- M( Y7 V b9 x4 G; d3 h3 a
// 分的过程
2 q+ ~! o# T# N: f# ~2 G
vector<int> merge_sort(vector<int> nums)
4 F$ Y! X2 J' ^6 s1 [) w
{
/ D4 V8 d4 g; u, V) w+ L. a
// 递归结束条件是只剩一个元素,则无序再分,直接返回
, \7 Q# c4 |# J. q& N+ w6 a1 G7 z
if (nums.size() == 1)
9 V# Y D, @' L7 H; ?$ r5 p+ H
return nums;
( k* Y- S0 M V3 f0 N' ]* a3 c1 k- V
4 S, d" C8 r+ l9 {% p' |: K
// 将大数组分治为左边的和右边的
+ k( U( G, H: s4 H8 ~) D1 h
vector<int> ivec1 = merge_sort(vector<int> (nums.begin(), nums.begin()+nums.size()/2));
+ y% _$ |4 s8 R
vector<int> ivec2 = merge_sort(vector<int> (nums.begin()+nums.size()/2, nums.end()));
8 L$ t! K9 }8 I) P3 r& `
// 返回合并后的大数组
2 p r3 @) ?/ q, u
return merge_vec(ivec1, ivec2);
$ I8 h/ L7 k' {+ \) W
}
0 d3 Z& z% y5 l' C, v
: ]* T% Q5 _- _6 l1 d5 b* h
分析:拆的过程时间复杂度是O(logn),合的过程时间复杂度是O(n),因此总的最好、最坏和平均时间复杂度是O(nlogn)。这种排序方法并非是原地排序,所以其空间复杂度是O(n)。这种方法并不会破坏相等元素之间的相对位置因此这是一种稳定的排序算法。
& {8 Y: ^/ _( _. w
6 B3 }' ^! R& M7 R, @
六、快速排序
9 e3 }9 r# M$ t* [2 Y# L: {
思路:快速排序同样也是利用分治法的思想,但是快速排序可以实现原地排序因此无序额外的空间。快速排序和归并排序的分的过程不同,快速排序分是根据小于和大于某个元素来分成两部分,而归并排序总是以中间的地方来划分。
% X8 m# |) j& x* `. i+ ]
9 t: F3 s) }, _7 K- A! R7 a
注意:算法中每一轮quicksort会确定一个元素的最终位置,我们递归处理这个元素左边的剩余数组和右边的剩余数组。lp和rp在走的时候,需要注意的只要rp指向的元素大于等于pivot就一直往左,lp指向的元素小于等于pivot就一直往右,若不加入等于这个判断条件可能就会在中途停下来而陷入死循环。而且pivot的选取也很关键,我们是以pivot大小来划分左右的,常见的方法可以以最左边或者最右边的元素作为pivot(但是这样在已经有序的数组中效率很差),或者随机选择pivot。
4 l: I7 j& p! {6 Z9 S7 l
) o; Q: t: S g
void quicksort(vector<int> &nums, vector<int>::iterator lp, vector<int>::iterator rp)
/ u1 I) t" w$ t K/ ^
{
0 \4 Y: b; K) _/ k- k4 @
// 若左右相等,说明只有一个元素,就不需要排序
N$ k$ \" ~5 I
if (rp - lp > 0)
2 ?: q: k1 z- R. ^" f6 _5 p
{
+ W, |, {; u! c: P5 a
// old和orp存取起始位置和结束为止
8 D) Q! J+ {4 ~
auto olp = lp, orp = rp;
1 L2 b8 t1 j& N3 _6 |) [: S
* |0 K4 H* _% x! x
// 下面两行代码可以要也可以去掉,其作用是随机选定一个范围在lp和rp之间的数作为pivot
6 ^: w7 m5 w' t
// 将这个数与最左边的数调换位置就可以通过*lp得到这个数
/ p0 A" L- H" u. t' q
int random = rand() % (rp - lp + 1);
n* V, a* S O& \
swap(*lp, *(lp + random));
- V3 l3 f- D0 w) z! U
+ O% L' n; q3 _" I+ o
int pivot = *lp;
' r" G. t/ f$ a, _
3 w! F# m2 ^7 e2 K* v( @$ m
// 当lp和rp没遇到的时候
- R4 B7 B3 s" U2 t3 K7 S( f
while (lp != rp)
6 y' ]/ k% l. \1 T+ ^
{
2 u0 x0 t4 Y9 w: n& i. D! V0 m
// 只要rp指向的元素大于等于pivot而且lp和rp没遇到,rp自减
+ |9 y/ {/ r. E0 O
// 将这里的 '>=' 换成 '<=' 并且把下面的 '<=' 换成 '>=' 就是从大到小
a( L9 |" W0 r4 G6 X1 M
while (*rp >= pivot && lp != rp)
* l& P2 T- p% W9 ]7 V( y& R, S$ b- Y, ]
--rp;
, h9 f! r9 A/ `5 C0 X+ t; a
// 只要lp指向的元素小于等于pivot而且lp和rp没遇到,lp自增
2 [3 B- m. g) H$ _5 j
while (*lp <= pivot && lp != rp)
/ G7 H6 Y( }8 M" I
++lp;
8 O! \, X' i& d" W
// 停下来的时候交换值
; D) v- `" {' q$ j
swap(*lp, *rp);
% d: y# U" l" g5 Y+ S- I* t
}
6 q! r/ U. j* L9 q
9 ]% C/ M- J2 G6 J
// lp遇到rp说明比pivot小的已经放在左边,比pivot大的已经放在右边了
) I3 J j# a9 Q9 D/ }1 _
// 因为while循环中rp先走,说明rp所指的元素一定是小于pivot或者正好是pivot
1 M2 y5 Q+ b2 |9 j# x r9 X
// 因此需要交换二者的值,同时pivot就被放在了正确的排序位置上
, W0 b0 K8 q# [! |- B" l' c% c3 M+ S
swap(*olp, *rp);
: }" @% u2 I* [$ X& s% d& I3 y
// 递归处理pivot的左边和右边
/ h% g3 i4 F! l
quicksort(nums, olp, lp-1);
" ~4 D0 }, ?' u+ m/ I' y
quicksort(nums, rp+1, orp);
1 h8 ]' B9 Y% g* G0 |
}
7 V$ r2 E2 _8 I+ v3 }
}
, f# F9 [* t: p9 K# l
' o' x- a6 v! g, f- F2 {/ b
6 k; b% \% W. f2 f; d
void quick_sort(vector<int> &nums)
4 H: v# I' J* F$ z# K' l" F
{
' g9 }4 ^* v' K' j9 J8 a
quicksort(nums, nums.begin(), nums.end()-1);
% N3 @( n8 H* Q. X% g5 I( o% N
}
4 N* t R$ B& _' A& Y* Y/ |9 S# t! _' ^
8 G6 u, ]8 L6 T& V, S5 u
分析:快速排序算法的时间复杂度分是O(logn),治是O(n),因此其最好和平均的复杂度是O(nlogn)。考虑一种情况,当数组有序而且我们选取pivot的方法是选最左边的或者最右边的元素时复杂度退化为O()。原地排序因此不需要额外空间,但是由于是递归函数,因此需要栈来保存状态,最好和平均情况下需要O(logn),最坏的情况下需要O(n)。由于快速排序涉及到随机位置值的交换,因此快速排序是一种不稳定的排序方法。
! ^' @$ p9 [! b$ p, X8 \' u
4 h# [+ A& k/ `9 R4 i0 t- P
七、堆排序
' w5 O5 G! D0 r; d0 n9 Q, p" C9 ]8 H
思路:堆排序顾名思义需要一个堆,堆是一个完全二叉树,可以分为大顶堆和小顶堆,其中大顶堆是满足子节点的值小于父节点的堆,小顶堆是满足子节点的值大于父节点的堆。建好了堆之后我们就可以通过取堆顶元素再不断调整堆的方法来得到排序结果。因为堆是完全二叉树,因此其父节点和子节点的关系容易得到,所以我们可以用数组来模拟一棵树(一个堆),下面这个视频将堆排序讲的很清晰。
% r8 j: l( _5 T. S8 e: L9 }# C+ I
& N) c0 L3 t- g X+ t) g
【从堆的定义到优先队列、堆排序】 10分钟看懂必考的数据结构——堆_哔哩哔哩_bilibili
$ ~8 w- ]+ V7 }, |" \- F
7 M8 n2 G# |: n6 x# S, |
建堆:建立堆的方式可以分为从下往上和从上往下。以大顶堆为例,从下往上的话,对于每个父节点,判断其子节点值是否存在大于父节点的情况,是的话就交换这父节点和子节点的值,然后继续调整子节点(若子节点也存在节点的话则继续往下调整)。如果是从上往下建堆,就相当于是堆从从空的开始,不断插入元素再进行调整,判断当前插入的选择值是否大于其父节点的值,若是的话则交换当前节点与父节点,并继续向上调整直到无需调整或者到根节点。可以判断,从下往上的方式其时间复杂度为O(n),而从上往下调整的方式其时间复杂度为O(nlogn)。同时需要注意的是,对于同一个数组,采用从下往上和从上往下的方式建立可能会导致节点的排列方式不一样,但是都满足大顶堆/小顶堆的性质。
% M3 m# m$ N W& q! y- g/ z; m
* U# M9 y- U5 G; p
下面是从下往上建大/小顶堆的代码:
* b6 f, Q0 \1 i/ ^
& u8 J% l; |4 A. \* Q6 v
// 接收参数为数组nums,当前调整节点下标i,当前堆的大小sz
0 I0 M% D& E. I! ]% Q( l4 e+ O# W
void adjust_from_buttom(vector<int> &nums, int i, int sz)
1 Y3 u e* @: v5 R
{
, x! ?9 K' w: H- Z w; Q4 q
// lpos和rpos分别代表左孩子和右孩子,largest用来存储左右孩子中较大的那个的下标
$ b3 v3 H" B0 t/ y
// 建小顶堆需将largest改为minest,此时这个变量用于存储较小的元素
G; |% p, f3 g
int lpos = 2*i+1, rpos = 2*i+2, largest = i;
( o& B1 ]2 E7 g U5 `1 N5 {
// 若有左孩子(下标小于sz)而且左孩子数值大于当前节点数值,就记录下左孩子下标
7 m6 G* x# \5 \% [1 g [7 m
// 建小顶堆需将 '>' 改为 '<'
' J& `0 y8 p1 j/ [" ?6 l0 [
if (lpos < sz && nums[lpos] > nums
)
6 i1 C, Z4 |' Q3 t. k/ `: m
largest = lpos;
' ^- v) M% |& n& n# M) k
// 若有右孩子(下标小于sz)而且右孩子数值大于最大的节点值,就记录下右孩子下标
# D( `! E, |, P" m/ E
// 建小顶堆需将 '>' 改为 '<'
1 U: ^! [5 N+ z( r, w
if (rpos < sz && nums[rpos] > nums[largest])
# M0 t- t1 l! n0 ~" \4 b
largest = rpos;
+ X$ U \- E4 R. m, W1 l# G
// 若存在某个孩子的值比当前值大
( V, W5 {" ?; R
if (largest != i)
5 x$ T. S, V3 ]8 p
{
' u3 c9 Z9 N; m4 Y* `3 t( v- N
// 交换当前节点和较大的那个孩子的值
" P; H. U w& g( {( R5 H9 L
swap(nums[largest], nums
);
- I! f5 s( ]! _! @( D2 h
// 交换完之后继续往上调整树
* j& Q- p6 i" a$ D+ X
adjust_from_buttom(nums, largest, sz);
8 F' C6 r2 h8 j8 S- y9 S
}
4 S$ `3 _' e( S- r
}
a8 L) ~: |* M& U G
: w( P; x# y i8 I2 X7 y3 C/ O
void build_heap_from_buttom(vector<int> &nums)
% }+ V2 n3 {! ?; o ~
{
. c& g' v+ V3 @# B8 Z/ f
// 若数组只有一个元素则无需建立堆
, }0 A' @# ]7 @( O
if (nums.size() != 1)
& E" S' c7 O7 ]' V+ J
// 从最后一个父节点开始循环,一直到根节点
2 U, I; b; H X* |" [5 }* m& Z: Y
for (int i = nums.size()/2 -1; i >= 0; --i)
8 ^/ R8 N4 X4 V1 a! ~
// 不断对堆进行调整
& O% M; ]1 g) l! ]+ H' u U& A
adjust(nums, i, nums.size());
: O* ]6 ?+ X: \6 V/ D
}
3 L1 x3 Q" y4 u/ o
; [1 N1 j' r0 ]# i" r$ F
下面是从上往下建大/小顶堆的代码:
/ k+ q) A: X# H6 \, q( j3 Z
$ [9 c* b8 M# g1 X1 {- i( J
void adjust_from_top(vector<int> &nums, int i, int sz)
. i# t" y7 e1 ^, b/ a1 l$ D) `5 h+ V
{
; f4 |0 W) X( x; T# j
// 如果i不等于0
6 w* {4 N5 q) f) U) }
if (i)
$ z# ~1 C2 ?4 h D
{
9 e1 S' B8 x) l6 J, l
// 若i为偶数,其父节点下标为i/2-1。若满足当前节点的值比父节点的值大
; W; y- A& ~8 d/ f$ {
// 建小顶堆需将 '>' 改为 '<'
0 W$ {" e0 w8 x# o4 ]6 ?0 y, F
if (!(i%2) && nums
> nums[i/2-1])
: J, ~) e8 V3 I% M6 o* s, M1 f: D
{
* F. M8 F1 J8 d% V. w
// 交换当前节点与其父节点,再检查父节点需不需要调整
- z6 ^- U) }# t1 c0 S1 x( e
swap(nums
, nums[i/2-1]);
; N% u @3 s" R) S: g
adjust_from_top(nums, i/2-1, sz);
: s$ \. ?( z- v- q5 E; }8 V
}
, x j9 M4 e3 f* c8 f& j
// 若i为奇数,其父节点下标为i/2,则当前节点比父节点的值大
6 R0 G3 Y2 g0 ?( i0 R
// 建小顶堆需将 '>' 改为 '<'
% a7 v7 x1 V# L4 d, ?% P
if (i%2 && nums
> nums[i/2])
5 C* P' e' w6 P$ y+ u
{
# S- W2 F) d4 n" B' `; _
// 交换当前节点与其父节点,再检查父节点需不需要调整
7 I& n) G2 p5 s9 x. B
swap(nums
, nums[i/2]);
+ V4 {+ h, }7 P
adjust_from_top(nums, i/2, sz);
+ [0 [3 z4 V3 e* J) m7 ~1 T7 S' S( n
}
4 O& B" V) y* E4 w1 b2 k; i+ J& w, }
}
2 i* b9 S: B: q3 w; T" }9 l
}
: g4 o+ o2 S- R4 i/ H
) J) B+ K6 S- J- d1 G* E* B! [
void build_heap_from_top(vector<int> &nums)
7 T6 M- q" f Z+ i
{ // 从第一个元素开始到最后一个元素结束
' j1 v. c7 c' I" S& O6 r& B% b- W [
for (int i = 0; i < nums.size(); ++i)
7 w8 W; ?" ` g
// 插入新的元素并调整
$ ]( e+ G) d8 O; x
adjust_from_top(nums, i, i+1);
$ t& X: o% w7 g% h3 [) c
}
$ D) P- |/ t& e5 n; {8 [
1 {. u; x" f. S% @% |* r% C# K
建立好的堆之后就可以通过取出堆的根节点,再不断调整堆来进行堆排序,我们可以把取出的节点与堆的最后一个节点进行交换,然后把堆的大小减一,这样就可以利用堆原有的空间来存储排序的结果,而无需额外开辟空间来存储。堆排序代码如下:
/ D5 C1 c' r% H, j1 |- c! o
: O' ]7 B, s5 h" S, G
void heap_sort(vector<int> &nums)
8 Q6 |0 G% c! V; N. Y2 h, S
{
9 N6 D# j! p6 D) ?
build_heap_from_buttom(nums); // 或者是build_heap_from_buttom(nums);
3 j* [4 b( R W9 e- j/ B' ~
// 从最后一个节点开始往上走
. a7 q- W: M6 h" C$ x7 g
for(int i = nums.size()-1; i > 0; --i)
( ?" F& d* H; @" p& W
{
3 U: v/ R! r# G4 E
// 将最后一个节点与堆的根节点交换
$ k- H1 n b$ T3 x
swap(nums
, nums[0]);
" r( z4 Q6 m' n/ _! U
// 调整堆,堆的大小为原大小减一
8 F1 Z5 U9 J3 p
adjust_from_buttom(nums, 0, i);
+ w1 P( p. J) ?9 P6 d7 Q
}
7 L. }% A& H7 f. d3 }
}
/ K, q4 M# r) p. D8 i* v
我们可以注意到堆排序的过程交换了节点之后,只有根节点发生了改变,因此只有可能是根节点不满足堆的性质,所以在调整的时候我们调用了adjust_from_buttom()方法来堆根节点进行调整。
/ R( ?: B. m1 g$ H6 l
6 Z2 |8 H$ v$ Z
分析:堆排序的时间复杂度包括建堆和调整,从下往上建堆时间复杂度为O(n),调整堆的时间复杂度为(logn),因此堆排序最好、最坏和平均情况的时间复杂度为O(nlogn)。堆排序不需要额外的空间因此其空间复杂度为O(1),但是由于建堆的过程中可能出现位置调整,因此堆排序是一种不稳定的排序方法。
8 D2 H- | k3 P
" U4 Y7 G0 e( p$ v& {6 n8 D
八、计数排序
y) \4 T8 C. I5 M1 T$ o6 f
思路:计数排序主要是针对一定范围内的整数来进行了,先确定序列中的最大值和最小值,从而开辟max-min+1大小的空间,空间的每一个位置代表一个数,若遍历到了某个数就将该空间的计数值自增,那么遍历完原数组。排序结果可以通过遍历这个空间来得到。在实现上C++中可以通过map来实现这个操作,因为map本身是保证有序的。当然因为map内部要进去排序,所以如果要实现极致的空间换时间的话,需要自己手动来实现这样的map。
# f9 ~" c' L5 X; m2 j) m. c
6 L8 N- S/ s# v$ O
void count_sort(vector<int> &nums)
* B. k: v. y# ^# p2 j9 H
{
4 Z% w* Q' m/ X& M
// 用于存储数与出现次数的对应关系
/ }) {$ |+ Q% i% w0 B) D6 ^+ a
map<int, int> cnt_map;
5 j( l, V D& y5 D
// 遍历数组以将元素及出现次数添加进map
9 r% ^8 X) O( T9 `& |, w: S$ |$ A
for (auto i : nums)
' r( C+ D* z3 T8 u% k( d4 M
{
/ o2 h7 f+ M2 P; W4 u
//
$ h5 U5 U4 A, ]5 m8 ^' ?! [
if (cnt_map.find(i) == cnt_map.end())
# J3 A7 A0 @0 d4 \' u0 g" d+ i# P% c
cnt_map
= 1;
+ V4 w) z7 M- p* T/ z% c% p
else
4 A4 n' S+ p7 i# Z
++cnt_map
;
- j/ }* l* f; D/ v( x
}
, t7 J: q2 x$ N5 f' W5 l
// idx代表原数组下标
|, N( R$ Z$ S/ k$ I# j
int idx = 0;
/ J. z/ m5 B; F9 _
// 遍历map以将map中的元素放回原数组
, x4 v7 O1 _2 A
for (auto it = cnt_map.begin(); it != cnt_map.end(); ++it)
* B, N6 P1 b" R, G* a) d; o
{
- g% o7 p5 |4 S. w7 T
while (it->second != 0)
) k' O7 h( H5 s
{
' n: e1 a: L" g$ r% \; n: y0 @
nums[idx++] = it->first;
- c: \' O, F: ]' ?5 g" w/ t+ Y
--it->second;
! B2 B, m3 k% H6 u" f' x# ~' F
}
4 r, }# |, z. y. e) T7 I5 b% a
}
, ^# L" J" L4 ?) R( P/ Q3 k
}
; q+ n/ n# q) q9 P2 V; Z: {6 S. Y! T
2 H2 m3 E" _; N6 ?* ~- A" i
分析:计数排序最好、最坏和平均情况下的时间复杂度都是O(n+k),n是表示遍历原数组的时间,k(数据范围)是表示遍历辅助空间的时间,其空间复杂度为O(k)。计数排序可以看做是一种稳定的排序,比如我们把计数排序存储每个元素的位置看成队列,那么就符合先进先出,所以是稳定的。
5 }, M! w9 F* j5 ?4 @/ i0 a* b
+ R4 ~! d7 B5 @8 f! t0 v
九、基数排序
- B' F( V4 m. D# Z- b
基数排序通常可以用在整数或字符串上,比如整数上就可以分0-9十个桶,通过比较个位,十位一直到最高位,分别把数装进相应的桶中,再依次取出,比较更高位再装进桶中,再取出,直到所有的数都在0这个桶中说明所有的数都排好序了。
& M' ?9 r5 B9 n, Z& ~; ^
3 [- |1 t0 [) B& F$ o4 q7 C8 v; Z; J
但是需要注意的是,一般的基数排序无法处理有负数的情况。针对负数,一般有两种解决方法:
+ X5 ]7 D' s6 f! g8 Y, V: j0 s1 @
2 M+ |+ m2 ?& D8 p5 u: j
1、另外开辟10个桶用来存储负数的情况(需要占用更多的空间)
- |4 F4 s- y1 n6 f
' ^) I8 C `, P! g
2、将所有元素变为正数再处理(可以将所有元素都加上最小负数的绝对值,但存在溢出风险),下面代码实现这种方式
) h5 F* T' i/ _7 C) Z/ |! P8 Q
+ o& m* @9 |3 T* Q7 G, R
void radix_sort(vector<int> &nums)
8 Z2 _: j' G9 R. `4 O& a( i
{
j4 B2 P6 T, N u) a9 V
// 开辟二维数组,第一维10代表十个桶,第二维当前为空
! H2 Z- M* }$ C3 d
vector<vector<int>> ivec(10, vector<int>(0));
, [% q0 ^1 D! \' D# `/ C4 d
// 用于取出最小元素,将所有元素都变为正数
5 P' K8 F8 U {$ U% p* Z, @
int min_num = *min_element(nums.begin(), nums.end());
; I' k# \* P* f Q5 W
if (min_num < 0)
) m& v8 T o( @7 t4 K
for (auto &i : nums)
5 e; v' Q9 K: p" ^) j' c$ f
i -= min_num;
& a: _7 `- d" d5 u
// 用来控制比较的位数,初始为1代表比较个位数
+ V8 ]5 r' h6 h4 }6 b
int digit = 1;
7 Z2 ]$ e* ^- z) @4 f) S
// 循环一直进行
8 B T8 O/ l3 M) D7 ]& x D
while (true)
3 P f: h) ^, W3 N. I8 {- M
{
. l! b- Y6 f. t4 F' ~1 v% c8 M9 m
// 对nums中所有元素遍历,将每个元素放入对应桶中
% ^1 J! a6 _1 g+ q% G" ~
for(auto i : nums)
+ a/ {/ U* P, _$ W
ivec[i%(digit*10)/digit].push_back(i);
. `! Q/ K2 {5 X% H
0 N, \# g$ c( m4 w7 K
// 这是循环终止条件,即所有元素都在0号桶中
9 O6 ?, `5 x. z2 u- w
if (ivec[0].size() == nums.size())
2 Q, y% f! o' J4 {
break;
7 R3 t1 S8 d/ Q! j: z; C, P
// 记录nums中的下标用于放回nums中
& C y; z* d5 M5 i1 f7 m5 `
int idx = 0;
/ \' l, {7 T" z! W: ~
// 依次从每个桶中拿出元素放回nums,取完之后清空桶
/ P2 ^- M. K2 G3 n6 B
for (int i = 0; i < 10; ++i)
& Y' d) f/ J! W# T
{
' d3 [- H5 ~% W! @. x, x
for(int j = 0; j < ivec
.size(); ++j)
; h4 W. }0 q% p! b, H
nums[idx++] = ivec
[j];
5 [, b- Z- o2 Q, F' ^; r
ivec
.clear();
. t8 I2 w) \* \( R
}
/ W0 J2 |0 N M- x: k+ N
// 下一次循环比较更高位
8 K3 _' p/ s: L
digit *= 10;
- l7 _- P8 v6 e" \3 B
}
$ F, d& a1 _8 j" l! |- U, v
// 排序完毕后将元素恢复为初始值
$ Z$ f# c9 p" m* X- X9 c3 ^2 o
if (min_num < 0)
- `, [- y4 g6 K! V8 W3 t
for (auto &i : nums)
8 S; q# p* h5 r3 U }
i += min_num;
1 E/ P5 ~; ~3 N2 Z/ D
}
- a _4 G+ t+ U! i- p/ o
0 W- @( q4 \- J
分析:基数排序的时间复杂度取决于待排序的元素中的最大位数k,如最大元素为1023,那么最大位数k=4。对于每一位我们需要遍历两遍数组,但是这里的两遍可以省略,因此最好、最坏和平均的时间复杂度都是O(k*n)。由于我们需要开辟一个额外的空间来把每个数放入桶中,因此空间复杂度为O(n)。又因为我们放入桶和从桶中拿出的操作都保证了先进先出,因此基数排序是一种稳定的排序方法。
) o. u/ {+ J1 p5 q, q2 a5 s
; e @, \* `" Y& J/ N( \$ ~8 v1 D
十、桶排序
8 K' g/ K& W1 u
前面计数排序和基数排序都是桶排序的一种特例。桶排序是这样一种排序,它将原来的数组分到不同的桶里,再分别对每个桶内部采用排序算法进行排序(可以用快排、可以用选择、冒泡等都没问题),最后将每个桶里的元素依次取出就得到了排好序的结果。因此桶排序如何分桶是一个关键的问题,如果分的好的话,每个桶都能均匀地承载一部分数据,最后时间复杂度就会比较理想。若果分的不好,很多数据都集中在一个桶里,那么最后的时间复杂度就很差(最差情况下会略大于桶内排序算法的效率),此外桶排序还需要额外的空间。
) q: \2 }% ]) q1 P; v& ]
0 L! u: B6 \3 v) u
void bucket_sort(vector<int> &nums, int bucket_cnt)
$ p5 ? m/ R2 H) m
{
1 J8 d" i1 |$ [. F' o
// 建立bucket_cnt个桶,每个桶初始为空
8 U- b( _0 Y4 J7 f P( e8 [
vector<vector<int>> ivec(bucket_cnt, vector<int>(0));
& Y, c6 o5 k- M5 Z
// 拿出数组中最大和最小的元素来确定每个桶之间的间隔
# v' j; C3 F9 [2 _) Q/ }
int min_ele = *min_element(nums.begin(), nums.end());
* [- q7 N9 c6 S$ N8 }
int max_ele = *max_element(nums.begin(), nums.end());
/ n9 ?+ d- ]0 v1 d* l5 d
int gap = (max_ele - min_ele) / bucket_cnt;
, w# }8 T8 L1 ?* R3 K! r& T/ H9 n- l
// 如果间隔比桶个数都小,那么直接排序可能更快
( ?& @ y# u5 @7 t/ T( b0 k u V
if (gap > bucket_cnt)
$ a' M2 ?6 D: j C/ T" U+ X6 N
{
' j+ m* w' X/ R* C" ]3 Y
// 遍历数组中每个元素
- Y" S3 X! b" R& C, T
for (auto i : nums)
6 k) y e- p9 _* m1 H6 ~0 X
{
0 E$ b W. Z# |6 I
// 确定元素所在的桶序号
+ z2 G' k' `; t& v6 v/ ? }
int bucket_num = (i-min_ele)/gap;
, p5 n6 C T4 m% Q7 T, f. z" l0 r
// 若算出的序号等于桶个数,那么说明越界了(比如数组中最大元素就会出现这样的情况)
. f$ J i2 x% a5 G1 ]
if (bucket_num == bucket_cnt)
7 D7 h5 b1 [" Y. e$ G4 _& H
--bucket_num;
5 m7 K, d( N$ o1 Z( y$ U0 T
// 将该元素装入桶中
4 t# Q4 I5 [4 r7 e: Q
ivec[bucket_num].push_back(i);
9 @/ x2 q# j1 [: a" l0 e
}
8 M3 C4 a0 F! ^4 h" L# S! r0 f% \
// idx记录原数组nums中的下标用于装回元素
/ N4 s% C2 _+ o7 s
int idx = 0;
' n, k4 z, x2 \
// 对每个桶先排序再往nums中装入元素,最后清空桶
, H/ d* f! |( c9 A
for (auto &vec : ivec)
+ a% z( ^$ m1 ]0 {- N* e6 d
{
' j5 P' s- V4 H" e4 x( {5 \. i0 ^3 X& E: B
quick_sort(vec);
& n5 s9 Q) I5 i( w0 ]0 j) O
for (const auto ele : vec)
1 F H5 H" k, n' D3 n; B; b9 n
nums[idx++] = ele;
9 k4 a( P% q! m4 z, ?
vec.clear();
+ ?7 l) w4 w' @# F( a
}
$ b6 m5 P& X& \* { [9 ~
}
: ^) B9 S# l. H
// 直接排序
- Q4 T7 T3 C+ E& {! E- l; U
else
" |$ w+ ^* d* Q$ O; t3 B$ Q
quick_sort(nums);
& S9 g/ i$ D3 b7 _6 v9 P( h# d" A
}
/ v5 R- B7 a* ^, f# u; }, L3 x
0 @. z# v+ d4 a4 }
分析:桶排序将原数组分为k个桶来处理,假设数组总数为n,那么每个桶装了n/k个数据,假设我们在桶的内部使用快速排序,其时间复杂度为O(klogk),那么对于所有桶来说,总的时间复杂度就是k*O((n/k)*log(n/k)) = O(n*log(n/k))。最好的情况是每个数据都装进一个桶,这样就无需排序了,因此最好的时间复杂度是O(n),平均情况的时间复杂度是O(n*log(n/k)),最坏的情况的可以接近O(nlogn),但是比O(nlogn)要更差(因为存在分桶等操作)。桶排序的空间复杂度是O(n+k),因为桶排序除了要装下原始数组长度的元素,还需要额外的k个桶,这k个桶系统会默认分配内存。桶排序是否稳定依赖于其内部的排序算法,若内部使用快排则不稳定,若内部使用归并则是稳定的。
! m6 z% l7 ?2 p& T1 B
————————————————
" u4 J" d9 f: a) v1 S5 _# w
版权声明:本文为CSDN博主「Xaiver_97」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
2 S7 W$ A5 w- V3 t' D# ]$ ~* M
原文链接:https://blog.csdn.net/Xavier_97/article/details/126722423
* _6 G% A# [- ~+ U( e+ g z% m6 M7 X
1 `/ u' d! {6 [9 T+ L
# }' X2 ?/ @6 J6 E; G+ n
欢迎光临 数学建模社区-数学中国 (http://www.madio.net/)
Powered by Discuz! X2.5