【史上最全内部排序算法】（直接插入、折半插入、希尔） +（冒泡、快速）+（简单选...

杨利霞 发表于 2022-9-4 17:18

【史上最全内部排序算法】（直接插入、折半插入、希尔） +（冒泡、快速）+（简单选择、堆{含元素的增删}）+（归并）+ （基数）排序 + 对比总结
文章目录
排序
1. 插⼊排序
（稳定）1.1 直接插入排序【适用于顺序存储和链式存储的线性表】
时间、空间复杂度
（稳定）1.2 折半插入排序【先⽤折半查找找到应该插⼊的位置，再移动元素】
时间、空间复杂度
（不稳定）1.3 希尔排序【多次直接插入排序】
时间、空间复杂度
2. 交换排序
2.1 (稳定）冒泡排序
时间、空间复杂度
2.2 (不稳定)快速排序【所有内部排序算法中，平均性能最优的排序算法】
时间、空间复杂度
3.选择排序
3.1 （不稳定）简单选择排序
时间、空间复杂度
3.2 （不稳定）堆排序
① 什么是堆、⼤根堆（⼤顶堆）、⼩根堆（⼩顶堆）？
② 建⽴⼤根堆：BuildMaxHeap(int A[], int len)、HeadAdjust(int A[], int k, int len)
③基于⼤根堆进⾏排序：HeapSort(int A[], int len)
时间、空间复杂度
④ 补充：在堆中插⼊新元素
⑤ 补充：在堆中删除元素
4. （稳定）归并排序
① 明白什么是“2路”归并？——就是“⼆合⼀”
② 一次“2路”归并的代码【Merge(int A[], int low, int mid, int high)】
③递归进行分治思想【MergeSort(int A[], int low, int high)】
④ 总实现代码
时间、空间复杂度
5. 基数排序
内部排序算法总结
排序
排序：重新排列表中的元素，使表中元素满足按关键字有序的过程。

排序算法的评价指标：时间复杂度、空间复杂度、稳定性。

算法的稳定性：关键字相同的元素在使用某一排序算法之后相对位置不变，则称这个排序算法是稳定的，否则称其为不稳定的。
稳定的排序算法不一定比不稳定的排序算法要好。

排序算法的分类：
内部排序：排序期间元素都在内存中——关注如何使时间、空间复杂度更低。
外部排序：排序期间元素无法全部同时存在内存中，必须在排序的过程中根据要求，不断地在内、外存之间移动——关注如何使时间、空间复杂度更低，如何使读/写磁盘次数更少。

各自排序算法演示过程参考：https://www.cs.usfca.edu/~galles/visualization/Algorithms.html

1. 插⼊排序
（稳定）1.1 直接插入排序【适用于顺序存储和链式存储的线性表】
基本操作就是：将有序数据后的第一个元素插入到已经排好序的有序数据中从而得到一个新的、个数加一的有序数据

算法解释：（从小到大）

算法三个步骤：

先保留要插入的数字
往后移
插入元素

// 对A[]数组中共n个元素进行插入排序
void InsertSort(int A[],int n){
int i,j,temp;
for(i=1; i<n; i++)
{
//如果是A <= A，直接就是有序了，就不用下面的步骤【也是算法稳定的原因】
      if(A<A)
      {
         temp=A;  //保留要插入的数字

         for(j=i-1; j>=0 && A>temp; --j)
            A=A; //所有大于temp的元素都向后挪

         A=temp;//插入元素
      }
}
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
用算法再带入这个例子，进行加深理解

带哨兵：

补充：对链表L进行插入排序

void InsertSort(LinkList &L){
LNode *p=L->next, *pre;
LNode *r=p->next;
p->next=NULL;
p=r;
while(p!=NULL){
      r=p->next;
      pre=L;
      while(pre->next!=NULL && pre->next->data<p->data)
         pre=pre->next;
      p->next=pre->next;
      pre->next=p;
      p=r;
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
时间、空间复杂度

最好情况：共n-1趟处理，每⼀趟只需要对⽐关键字1次，不⽤移动元素
最好时间复杂度—— O(n)

最坏情况：【感觉第1趟：对⽐关键字2次，移动元素1次？】
第1趟：对⽐关键字2次，移动元素3次
第2趟：对⽐关键字3次，移动元素4次
…
第 i 趟：对⽐关键字 i+1次，移动元素 i+2 次
最坏时间复杂度——O(n2)

（稳定）1.2 折半插入排序【先⽤折半查找找到应该插⼊的位置，再移动元素】
过程：

//对A[]数组中共n个元素进行折半插入排序
void InsertSort(int A[], int n)
{
int i,j,low,high,mid;
for(i=2; i<=n; i++)
{
      A=A; //存到A
      //-----------------折半查找【代码一样】---------------------------
      low=1; high=i-1;
      while(low<=high){
         mid=(low+high)/2;
         if(A>A)
            high=mid-1;
         else
            low=mid+1;
      }
      //--------------------------------------------
      for(j=i-1; j>high+1; --j)//右移
         A=A;

      A=A;//插入
}
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
时间、空间复杂度
空间复杂度：O(1)

【右移】的次数变少了，但是关键字对⽐的次数依然是O(n2) 数量级，整体来看时间复杂度依然是O(n2)

（不稳定）1.3 希尔排序【多次直接插入排序】
是希尔（Donald Shell）于1959年提出的一种排序算法。希尔排序也是一种插入排序，它是简单插入排序经过改进之后的一个更高效的版本，也称为缩小增量排序，同时该算法是冲破O(n2）的第一批算法之一。

算法思想

希尔排序是把记录按下标的一定增量分组，对每组使用直接插入排序算法排序；
随着增量逐渐减少，每组包含的关键词越来越多，当增量减至1时，整个文件恰被分成一组，算法便终止。
图解：

代码实现：

//从小到大
void shellSort(int* arr, int n)
{
      int gap, i, j, temp;
      //小组的个数，小组的个数从n/2个，变成n/4，再变变变，越来越少，直到变成一个
      for (gap = n / 2; gap >= 1; gap = gap / 2)
      {
         //**********************************直接插入排序（只是步长改变）**************************************************
         for (i = gap; i < n; i++)  //因为这个小组的元素使隔了gap个，所以排的时候也要隔gap个
         {
            if (arr < arr)
            {
                  temp = arr;

                  //后移
                  for (j = i - gap; j >= 0 && temp < arr; j -= gap)
                     arr = arr;

                  arr = temp;//插入进去
            }
         }
         //************************************************************************************
      }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
时间、空间复杂度
空间复杂度：O(1)

时间复杂度：和步长的大小有关，⽬前⽆法⽤数学⼿段证明确切的时间复杂度，最坏时间复杂度为 O(n2)，当n在某个范围内时，可达O(n1.3)

稳定性：不稳定！

适⽤性：仅适⽤于顺序表，不适⽤于链表

2. 交换排序
2.1 (稳定）冒泡排序
英文:bubble sort    (bubble 动和名词起泡，冒泡)
从头到尾相邻的两个元素进行比较大小顺序不满足就交换两个元素位置

每一轮比较会让一个最大数字沉底或者一个最小数字上浮

这个算法的名字由来是因为越大的元素会经由交换慢慢“浮”到数列的顶端（升序或降序排列），就如同碳酸饮料中二氧化碳的气泡最终会上浮到顶端一样，故名“冒泡排序”。

实现代码：

//从小到大：
void bubble_sort(int arr[], int len)//冒泡排序int*arr
{
int temp;
for (int i = 0; i < len - 1; ++i)//循环比较次数
{
//for (int j = 0; j < len - 1; ++j)//从头到尾比较一轮
for (int j = 0; j < len - 1 - i; ++j)//相对于上面的一个优化
{
if (arr > arr)//发现两个位置不对的元素//j+1<len
{
//交换两个元素位置
temp = arr;
arr = arr;
arr = temp;
}
}
}
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
优化代码【当初始序列有序时，外层for会执行“【1】”，从而外层for只执行了一次】：

//从小到大：
void bubble_sort(int arr[], int len)
{
int temp;
bool flag;
for (int i = 0; i < len - 1; ++i)
{
      //表示本趟冒泡是否发生交换的标志
flag=false;

for (int j = 0; j < len - 1 - i; ++j)
{
if (arr > arr)//稳定的原因
{
temp = arr;
arr = arr;
arr = temp;
//有发生交换
flag=true;
}
}//for

//本趟遍历后没有发生交换，说明表已经有序
if(flag==false)return;【1】
}//for
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
时间、空间复杂度

适用性：冒泡排序可以用于顺序表、链表

2.2 (不稳定)快速排序【所有内部排序算法中，平均性能最优的排序算法】
算法思想：
在待排序表L中任取⼀个元素pivot作为枢轴（或基准，通常取⾸元素），
通过⼀趟排序将待排序表划分为独⽴的两部分L 和 L，
使得L中的所有元素⼩于pivot，L中的所有元素⼤于等于pivot，
再令pivot放在位置L(k)上，这个过程称为⼀次“划分”。

然后分别递归地对两个⼦表重复上述过程，直⾄每部分内只有⼀个元素或空为⽌，即所有元素放在了其最终位置上。

划分的过程：

初始状态：取首元素为pivot，定义low，high指针

首元素为49
high指针指向的数据小于49，就放在low指向的位置
low指针指向的数据大于49，就放在high指向的位置

// 用第一个元素将数组A[]划分为两个部分
int Partition(int A[], int low, int high){
//取首元素为pivot
int pivot = A;

while(low<high)
{
//先是high开始向左移动
      while(low<high && A>=pivot)
         --high;
      A = A;

      //随后low向右移动
      while(low<high && A<=pivot)
         ++low;
      A = A;
}

//low=high的位置，即pivot放在的位置
A = pivot;

return low;
}

// 对A[]数组的low到high进行快速排序
void QuickSort(int A[], int low, int high){
if(low<high){
      int pivotpos = Partition(A, low, high);  //划分
      QuickSort(A, low, pivotpos - 1);
      QuickSort(A, pivotpos + 1, high);
}
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
时间、空间复杂度

把n个元素组织成⼆叉树，⼆叉树的层数就是递归调⽤的层数

n个结点的⼆叉树：最⼩⾼度 = ⌊log2n⌋ + 1，最⼤⾼度 = n

时间复杂度=O(n*递归层数)
最好时间复杂度=O(n * log2n)
最坏时间复杂度=O(n2)
平均时间复杂度=O(n * log2n)，是所有内部排序算法中平均性能最优的排序算法

空间复杂度=O(递归层数)
最好空间复杂度=O(log2n)
最坏空间复杂度=O(n)

最坏的情况

⽐较好的情况

不稳定的原因：

3.选择排序
选择排序：每⼀趟在待排序元素中，选取关键字最⼩（或最⼤）的元素加⼊有序⼦序列

3.1 （不稳定）简单选择排序
算法思路：每一趟在待排序元素中，选取关键字最小的元素与待排序元素中的第一个元素交换位置

// 交换a和b的值
void swap(int &a, int &b){
int temp = a;
a = b;
b = temp;
}

// 对A[]数组共n个元素进行选择排序
void SelectSort(int A[], int n)
{
//一共进行n-1趟，i指向待排序序列中第一个元素
for(int i=0; i<n-1; i++)
{
      int min = i;
      for(int j=i+1; j<n; j++){ //在A中选择最小的元素
         if(A<A)
            min = j;
      }
      if(min!=i)
         swap(A, A);
}
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
补充：对链表进行简单选择排序

void selectSort(LinkList &L){
LNode *h=L,*p,*q,*r,*s;
L=NULL;
while(h!=NULL){
      p=s=h; q=r=NULL;
      while(p!=NULL){
         if(p->data>s->data){
            s=p; r=q;
         }
         q=p; p=p->next;
      }
      if(s==h)
         h=h->next;
      else
         r->next=s->next;
      s->next=L; L=s;
}
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
时间、空间复杂度

适用性：适用于顺序存储和链式存储的线性表。

3.2 （不稳定）堆排序
① 什么是堆、⼤根堆（⼤顶堆）、⼩根堆（⼩顶堆）？
堆是具有以下性质的完全二叉树：
每个结点的值都大于或等于其左右孩子结点的值，称为大顶堆；
或者每个结点的值都小于或等于其左右孩子结点的值，称为小顶堆。

即：
若满⾜：L(i) ≥ L(2i) 且 L(i) ≥ L(2i+1) （1 ≤ i ≤n/2）—— ⼤根堆（⼤顶堆）
若满⾜：L(i) ≤ L(2i) 且 L(i) ≤ L(2i+1) （1 ≤ i ≤n/2）—— ⼩根堆（⼩顶堆）

② 建⽴⼤根堆：BuildMaxHeap(int A[], int len)、HeadAdjust(int A[], int k, int len)
思路：
把所有⾮终端结点都检查⼀遍，看是否满⾜⼤根堆的要求，如果不满⾜，则进⾏调整

在顺序存储的完全⼆叉树中，⾮终端结点编号 i≤⌊n/2⌋，也就是检查 i=1 到 i=⌊n/2⌋ 之间的所有结点

检查内容：是否满⾜根 ≥ 左、右，若不满⾜，将当前结点与其更⼤的⼀个孩⼦互换

过程例子：

建⽴⼤根堆（代码）：

// 对初始序列建立大根堆
void BuildMaxHeap(int A[], int len){
for(int i=len/2; i>0; i--) //从后往前调整所有非终端结点
      HeadAdjust(A, i, len);
}

// 将以k为根的子树调整为大根堆
void HeadAdjust(int A[], int k, int len){
A = A;
for(int i=2*k; i<=len; i*=2){ //沿k较大的子结点向下调整
      if(i<len && A<A)
         i++;
      if(A >= A)
         break;
      else{
         A = A; //将A调整至双亲结点上
         k=i; //修改k值，以便继续向下筛选
      }
}
A = A
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
③基于⼤根堆进⾏排序：HeapSort(int A[], int len)
选择排序：每⼀趟在待排序元素中，选取关键字最⼩（或最⼤）的元素加⼊有序⼦序列

堆排序：每⼀趟将堆顶元素加⼊有序⼦序列（即与待排序序列中的最后⼀个元素交换）

过程：

// 交换a和b的值
void swap(int &a, int &b){
int temp = a;
a = b;
b = temp;
}

// 对长为len的数组A[]进行堆排序
void HeapSort(int A[], int len){
//初始建立大根堆
BuildMaxHeap(A, len);

//n-1趟的交换和建堆过程
for(int i=len; i>1; i--)
{
      swap(A, A);
      HeadAdjust(A,1,i-1);
}
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
时间、空间复杂度
建堆时间 O(n)，之后进行 n-1 次向下调整操作，每次调整时间复杂度为 O(log2n)；
故时间复杂度 = O(n) + O(n * log2n) = O(n* log2n)

空间复杂度 = O(1)

结论：堆排序是不稳定的

④ 补充：在堆中插⼊新元素
对于⼩根堆，新元素放到表尾，并与⽗节点对⽐，若新元素⽐⽗节点更⼩，则将⼆者互换。
新元素就这样⼀路“上升”，直到⽆法继续上升为⽌

⑤ 补充：在堆中删除元素
被删除的元素⽤堆底元素替代，然后让该元素不断“下坠”，直到⽆法下坠为⽌

4. （稳定）归并排序
归并：把两个或多个已经有序的序列合并成⼀个

① 明白什么是“2路”归并？——就是“⼆合⼀”

多路归并：

② 一次“2路”归并的代码【Merge(int A[], int low, int mid, int high)】

B[ i ] = B[ j ]时，优先用B[ i ]，故算法稳定

③递归进行分治思想【MergeSort(int A[], int low, int high)】

④ 总实现代码
// 辅助数组B
int *B=(int *)malloc(n*sizeof(int));

// A，A各自有序，将这两个部分归并
void Merge(int A[], int low, int mid, int high){
int i,j,k;
for(k=low; k<=high; k++)
      B=A;
for(i=low, j=mid+1, k=i; i<=mid && j<= high; k++){
      if(B<=B)
         A=B;
      else
         A=B;
}
while(i<=mid)
      A=B;
while(j<=high)
      A=B;
}

// 递归操作（使用了分治法思想）
void MergeSort(int A[], int low, int high){
if(low<high){
      int mid = (low+high)/2;
      MergeSort(A, low, mid);
      MergeSort(A, mid+1, high);
      Merge(A,low,mid,high);    //归并
}
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
时间、空间复杂度

5. 基数排序
直接看课本的过程图来理解P352

再看这个例子：

算法思想：把整个关键字拆分为d位，按照各个关键字位递增的次序（比如：个、十、百），做d趟“分配”和“收集”，若当前处理关键字位可能取得r个值，则需要建立r个队列。
分配：顺序扫描各个元素，根据当前处理的关键字位，将元素插入相应的队列。一趟分配耗时 O(n) 。
收集：把各个队列中的结点依次出队并链接。一趟收集耗时 O( r ) 。
基数排序擅长处理的问题：
①数据元素的关键字可以方便地拆分为d组，且d较小。
②每组关键字的取值范围不大，即r较小。
③ 数据元素个数n较大。
算法效率分析：
时间复杂度：一共进行d趟分配收集，一趟分配需要 O(n) ，一趟收集需要O( r ) ，时间复杂度O ，且与序列的初始状态无关.
空间复杂度： O( r ) ，其中r为辅助队列数量。
稳定性：稳定。

内部排序算法总结

————————————————
版权声明：本文为CSDN博主「我把夜熬成了白_」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/weixin_42214698/article/details/126520969

页: [1]

数学建模社区-数学中国's Archiver

【史上最全内部排序算法】（直接插入、折半插入、希尔） +（冒泡、快速）+（简单选...