【数据结构初阶】--快速排序进阶

发布于:2025-08-09 ⋅ 阅读:(14) ⋅ 点赞:(0)

🔥个人主页:@草莓熊Lotso

🎬作者简介:C++研发方向学习者

📖个人专栏: 《C语言》 《数据结构与算法》《C语言刷题集》《Leetcode刷题指南》

⭐️人生格言:生活是默默的坚持,毅力是永久的享受。

前言: 在之前的博客中我们实现了递归版本和非递归版本的快速排序,其中递归版本中的找基准的方法我们学习了三种。但是有些特殊的情况,比如重复元素过多或者已经有序的时候,我们的时间效率就会受到影响了,这次的进阶篇中,我们会通过一些方法来优化快速排序


目录

一.三数取中和随机数选择基准

三数取中法:

随机数选择法: 

两种方法的对比分析 :

 二.三路划分

实现步骤: 

代码实现: 

三路划分和传统二路划分思路的对比: 

 三.自省排序

核心思想: 

代码实现:


一.三数取中和随机数选择基准

三数取中法:

原理:从子数组的首元素、尾元素、中间元素中选择中位数作为基准。通过选取中间大小的值,避免极端值(如最大/最小值)作为基准,从而平衡左右子数组的划分。

核心逻辑:

  1. 计算子数组的中间索引 mid = left + (right - left) / 2;
  2. 比较 arr[left]、arr[mid]、arr[right] 三个元素;
  3. 将三者中的中位数作为基准,并交换到合适位置。

代码实现: 

//三数取中
int threewaymid(int* arr, int left, int right)
{
	int mid = (left + right) / 2;
	if (arr[left] > arr[right])
	{
		swap(&arr[left], &arr[right]);
	}
	if (arr[mid] > arr[right])
	{
		swap(&arr[mid], &arr[right]);
	}
	if (arr[mid] < arr[left])
	{
		swap(&arr[mid], &arr[left]);
	}
	return mid;
}

 --注意我这里返回的下标,后续需要在快速排序主体函数里面操作一下

随机数选择法: 

原理:从子数组的 [left, right] 范围内随机选择一个元素作为基准。通过随机性避免固定模式导致的最坏情况(如对有序数组排序时总是选首元素作为基准)。

核心逻辑:

  1. 生成 [left, right] 范围内的随机整数作为基准索引;
  2. 将随机选中的元素与固定位置交换。

 代码实现:(直接在快排主函数里面)

//随机数取法
srand((unsigned int)time(NULL));
int randi = left + rand() % (right - left + 1);
swap(&arr[left], &arr[randi]);

两种方法的对比分析 :

实际使用场景建议: 

1. 优先选择三数取中:
在多数实际场景(尤其是可能存在部分有序的数据)中,三数取中法的划分平衡性更稳定,且无随机数生成的额外开销,综合性能更优。C语言标准库中的快速排序实现(如qsort)常采用类似优化。

2. 随机数法的补充场景:
当数据分布完全未知或需要避免潜在的“对抗性输入”(如刻意构造的最坏情况数组)时,随机数选择法是更安全的选择。 


 二.三路划分

前面实现的两个方式是解决如何找key的问题以及数组接近有序的情况,而三路划分主要是用于处理有大量与Key值相同的元素时的情况。

在快速排序中,当数组存在大量重复元素时,传统的二路划分(小于基准/大于基准)会导致分割失衡,效率下降。三路划分 通过将数组分为“小于基准、等于基准、大于基准”三部分,有效解决重复元素问题,提升排序稳定性。 

核心逻辑: 将数组划分为3个部分(其中begin和end分别记录left和right的初始位置)

  • arr[begin,left-1],所有元素都小于基准
  • arr[left,right],所有元素都等于基准
  • arr[right+1,end],所有元素都大于基准

实现步骤: 

1.选择基准:我们可以采用面的三数取中或者随机数选择法

2.初始化指针:

  • begin记录left初始位置
  • end记录right初始位置
  • cur=left+1,遍历使用的指针

3.遍历和划分: 

  • 若 arr[cur] < key:交换 arr[cur] 与 arr[left],left++,cur++(扩展小于区域)
  • 若 arr[cur] == key:cur++(直接纳入等于区域)
  • 若 arr[cur] > key:交换 arr[cur] 与 arr[right],right--(扩展大于区域,cur不变,需重新检查交换后的元素)
     

4.递归处理: 遍历结束后,递归排序arr[begin,left-1],arr[right+1,end]

代码实现: 

//快速排序进阶
//三路划分实现快速排序(结合随机数法或三位取中)--应对大量重复数据和有序的情况

//三数取中
int threewaymid(int* arr, int left, int right)
{
	int mid = (left + right) / 2;
	if (arr[left] < arr[right])
	{
		swap(&arr[left], &arr[right]);
	}
	if (arr[mid] > arr[right])
	{
		swap(&arr[mid], &arr[right]);
	}
	if (arr[mid] < arr[left])
	{
		swap(&arr[mid], &arr[left]);
	}
	return mid;
}

void QuickSortMore(int* arr, int left, int right)
{
	if (left >= right)
	{
		return;
	}

	////随机数取法
	//srand((unsigned int)time(NULL));
	//int randi = left + rand() % (right - left + 1);
	//swap(&arr[left], &arr[randi]);

	//三数取中
	int midi = threewaymid(arr, left, right);
	swap(&arr[midi], &arr[left]);

	int key = arr[left];
	int cur = left + 1;
	int begin = left;
	int end = right;

	while (cur <= right)
	{
		if (arr[cur] < key)
		{
			swap(&arr[left], &arr[cur]);
			left++;
			cur++;
		}
		else if (arr[cur] > key)
		{
			swap(&arr[right], &arr[cur]);
			right--;
		}
		else {
			cur++;
		}
	}
		//三路划分【begin,left-1】【left,right】【right+1,end】
		QuickSortMore(arr, begin, left - 1);
		QuickSortMore(arr, right + 1, end);
}

图示如下: 

--我们通过上面描述的操作通过画图模拟过程后可以发现,确实能成功的划分出来三个部分,且每个分区的边界都很清晰

三路划分和传统二路划分思路的对比: 

总结:三路划分是对传统快排的针对性优化,在重复元素场景下优势明显,而在随机分布的无重复元素场景中,性能与传统快排接近(仅略高常数开销),是一种更通用的快排改进方案。

--这里给大家提供一个测试快排效率的代码,大家可以自己去试试 

#include<stdio.h>
#include<stdlib.h>
#include<time.h>
#include<string.h>
void PrintArray(int* a, int n) {
    for (int i = 0; i < n; ++i) {
        printf("%d ", a[i]);
    }
    printf("\n");
}
void Swap(int* p1, int* p2) {
    int tmp = *p1;
    *p1 = *p2;
    *p2 = tmp;
}
// hoare
// [left, right]
int PartSort1(int* a, int left, int right) {
    int keyi = left;
    ++left;
    while (left <= right) { //left和right相遇的位置的值⽐基准值要⼤
//right找到⽐基准值⼩或等
        while (left <= right && a[right] > a[keyi]) {
            right--;
        }
//left找到⽐基准值⼤或等
        while (left <= right && a[left] < a[keyi]) {
            left++;
        }
//right left
        if (left <= right) {
            Swap(&a[left++], &a[right--]);
        }
    }
//right keyi交换
    Swap(&a[keyi], &a[right]);
    return right;
}
// 前后指针
int PartSort2(int* a, int left, int right) {
    int prev = left;
    int cur = left + 1;
    int keyi = left;
    while (cur <= right) {
        if (a[cur] < a[keyi] && ++prev != cur) {
            Swap(&a[prev], &a[cur]);
        }
        ++cur;
    }
    Swap(&a[prev], &a[keyi]);
    keyi = prev;
    return keyi;
}
typedef struct {
    int leftKeyi;
    int rightKeyi;
} KeyWayIndex;
// 三路划分
KeyWayIndex PartSort3Way(int* a, int left, int right) {
    int key = a[left];
// left和right指向就是跟key相等的区间
// [开始, left-1][left, right][right+1, 结束]
    int cur = left + 1;
    while (cur <= right) {
// 1、cur遇到⽐key⼩,⼩的换到左边,同时把key换到中间位置
// 2、cur遇到⽐key⼤,⼤的换到右边
        if (a[cur] < key) {
            Swap(&a[cur], &a[left]);
            ++cur;
            ++left;
        } else if (a[cur] > key) {
            Swap(&a[cur], &a[right]);
            --right;
        } else {
            ++cur;
        }
    }
    KeyWayIndex kwi;
    kwi.leftKeyi = left;
    kwi.rightKeyi = right;
    return kwi;
}
void TestPartSort1() {
    int a1[] = { 6, 1, 7, 6, 6, 6, 4, 9 };
    int a2[] = { 3, 2, 3, 3, 3, 3, 2, 3 };
    int a3[] = { 2, 2, 2, 2, 2, 2, 2, 2 };
    PrintArray(a1, sizeof(a1) / sizeof(int));
    int keyi1 = PartSort1(a1, 0, sizeof(a1) / sizeof(int) - 1);
    PrintArray(a1, sizeof(a1) / sizeof(int));
    printf("hoare keyi:%d\n\n", keyi1);
    PrintArray(a2, sizeof(a2) / sizeof(int));
    int keyi2 = PartSort1(a2, 0, sizeof(a2) / sizeof(int) - 1);
    PrintArray(a2, sizeof(a2) / sizeof(int));
    printf("hoare keyi:%d\n\n", keyi2);
    PrintArray(a3, sizeof(a3) / sizeof(int));
    int keyi3 = PartSort1(a3, 0, sizeof(a3) / sizeof(int) - 1);
    PrintArray(a3, sizeof(a3) / sizeof(int));
    printf("hoare keyi:%d\n\n", keyi3);
}
void TestPartSort2() {
    int a1[] = { 6, 1, 7, 6, 6, 6, 4, 9 };
    int a2[] = { 3, 2, 3, 3, 3, 3, 2, 3 };
    int a3[] = { 2, 2, 2, 2, 2, 2, 2, 2 };
    PrintArray(a1, sizeof(a1) / sizeof(int));
    int keyi1 = PartSort2(a1, 0, sizeof(a1) / sizeof(int) - 1);
    PrintArray(a1, sizeof(a1) / sizeof(int));
    printf("前后指针 keyi:%d\n\n", keyi1);
    PrintArray(a2, sizeof(a2) / sizeof(int));
    int keyi2 = PartSort2(a2, 0, sizeof(a2) / sizeof(int) - 1);
    PrintArray(a2, sizeof(a2) / sizeof(int));
    printf("前后指针 keyi:%d\n\n", keyi2);
    PrintArray(a3, sizeof(a3) / sizeof(int));
    int keyi3 = PartSort2(a3, 0, sizeof(a3) / sizeof(int) - 1);
    PrintArray(a3, sizeof(a3) / sizeof(int));
    printf("前后指针 keyi:%d\n\n", keyi3);
}
void TestPartSort3() {
//int a0[] = { 6,1,2,7,9,3,4,5,10,4 };
    int a1[] = { 6, 1, 7, 6, 6, 6, 4, 9 };
    int a2[] = { 3, 2, 3, 3, 3, 3, 2, 3 };
    int a3[] = { 2, 2, 2, 2, 2, 2, 2, 2 };
    PrintArray(a1, sizeof(a1) / sizeof(int));
    KeyWayIndex kwi1 = PartSort3Way(a1, 0, sizeof(a1) / sizeof(int) - 1);
    PrintArray(a1, sizeof(a1) / sizeof(int));
    printf("3Way keyi:%d,%d\n\n", kwi1.leftKeyi, kwi1.rightKeyi);
    PrintArray(a2, sizeof(a2) / sizeof(int));
    KeyWayIndex kwi2 = PartSort3Way(a2, 0, sizeof(a2) / sizeof(int) - 1);
    PrintArray(a2, sizeof(a2) / sizeof(int));
    printf("3Way keyi:%d,%d\n\n", kwi2.leftKeyi, kwi2.rightKeyi);
    PrintArray(a3, sizeof(a3) / sizeof(int));
    KeyWayIndex kwi3 = PartSort3Way(a3, 0, sizeof(a3) / sizeof(int) - 1);
    PrintArray(a3, sizeof(a3) / sizeof(int));
    printf("3Way keyi:%d,%d\n\n", kwi3.leftKeyi, kwi3.rightKeyi);
}
int main() {
    TestPartSort1();
    TestPartSort2();
    TestPartSort3();
    return 0;
}

 三.自省排序

“自省排序”(Introspective Sort,简称IntroSort)是对快速排序的一种增强优化算法,它结合了快速排序、堆排序和插入排序的优点,通过“自省”(监控排序过程)动态调整排序策略,避免快速排序在极端情况下的性能退化,是一种兼具高效性和稳定性的综合排序方案。

核心思想: 

  1. 初始阶段使用快速排序,利用其在平均情况下的高效性(O(n log n));
  2. 通过监控递归深度,当深度超过阈值(通常为 2×logn))时,判断可能出现了分割失衡,自动切换为堆排序,避免快排最坏情况的O(n²)时间复杂度;
  3. 当子数组规模小于阈值(如16)时,切换为插入排序,减少递归和分割的开销。

这种“自省”机制确保了算法在各种数据场景下的稳定性,既保留快排的平均高效性,又通过堆排序兜底最坏情况。

代码实现:

--我这里的部分实现和前面一些示例会有一些差别,但是都是正确的,大家都可以参考实现一下。

#include"introsort.h"

void Swap(int* x, int* y)
{
	int tmp = *x;
	*x = *y;
	*y = tmp;
}
void AdjustDown(int* a, int n, int parent)
{
	int child = parent * 2 + 1;
	while (child < n)
	{
		// 选出左右孩⼦中⼤的那⼀个
		if (child + 1 < n && a[child + 1] > a[child])
		{
			++child;
		}
		if (a[child] > a[parent])
		{
			Swap(&a[child], &a[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
		{
			break;
		}
	}
}
void HeapSort(int* a, int n)
{
	// 建堆 -- 向下调整建堆 -- O(N)
	for (int i = (n - 1 - 1) / 2; i >= 0; --i)
	{
		AdjustDown(a, n, i);
	}
	// 需要自己先实现 -- O(N*logN)

	int end = n - 1;
	while (end > 0)
	{
		Swap(&a[end], &a[0]);
		AdjustDown(a, end, 0);
		--end;
	}
}
void InsertSort(int* a, int n)
{
	for (int i = 1; i < n; i++)
	{
		int end = i - 1;
		int tmp = a[i];
		// 将tmp插⼊到[0,end]区间中,保持有序
		while (end >= 0)
		{
			if (tmp < a[end])
			{
				a[end + 1] = a[end];
				--end;
			}
			else
			{
				break;
			}
		}
		a[end + 1] = tmp;
	}
}

// 三值取中函数
int MedianOfThree(int* arr, int left, int right)
{
	int mid = left + (right - left) / 2;

	// 比较并交换,确保 arr[left] <= arr[mid] <= arr[right]
	if (arr[left] > arr[mid])
		Swap(&arr[left], &arr[mid]);
	if (arr[left] > arr[right])
		Swap(&arr[left], &arr[right]);
	if (arr[mid] > arr[right])
		Swap(&arr[mid], &arr[right]);

	// 使用中间值作为基准值,并将其移到 left 位置
	Swap(&arr[left], &arr[mid]);

	return arr[left]; // 返回基准值
}

void IntroSort(int* a, int left, int right, int depth, int defaultDepth)
{
	if (left >= right)
		return;

	// 数组⻓度小于16的小数组,换为插入排序,简单递归次数
	if (right - left + 1 < 16)
	{
		InsertSort(a + left, right - left + 1);
		return;
	}
	// 当深度超过2*logN时改用堆排序

	if (depth > defaultDepth)
	{
		HeapSort(a + left, right - left + 1);
		return;
	}
	depth++;
	int begin = left;
	int end = right;
	// 随机选key
	int randi = left + (rand() % (right - left + 1));
	Swap(&a[left], &a[randi]);
	//也可以三值取中选key
	//int key = MedianOfThree(arr, left, right);
	int prev = left;
	int cur = prev + 1;
	int keyi = left;
	while (cur <= right)
	{
		if (a[cur] < a[keyi] && ++prev != cur)
		{
			Swap(&a[prev], &a[cur]);
		}
		++cur;
	}
	Swap(&a[prev], &a[keyi]);
	keyi = prev;
	// [begin, keyi-1] keyi [keyi+1, end]
	IntroSort(a, begin, keyi - 1, depth, defaultDepth);
	IntroSort(a, keyi + 1, end, depth, defaultDepth);
}
void QuickSort(int* a, int left, int right)
{
	int depth = 0;
	int logn = 0;
	int N = right - left + 1;
	for (int i = 1; i < N; i *= 2)
	{
		logn++;
	}

	// introspective sort -- ⾃省排序
	IntroSort(a, left, right, depth, logn * 2);

}
int* sortArray(int* nums, int numsSize, int* returnSize)
{
	srand(time(0));
	QuickSort(nums, 0, numsSize - 1);

	*returnSize = numsSize;
	return nums;
}

我这里的代码演示是直接在力扣上排序数组这道题里测试的,这个题目也是非常有意思的,官方的快排答案竟然过不了。大家可以用我们上面实现的三路划分或者这个自省排序,都可以通过这道题,当然像其它的几个时间复杂度比较优秀的排序算法也可以通过。

题目链接:912. 排序数组 - 力扣(LeetCode)


往期回顾:

【数据结构初阶】--排序(一):直接插入排序,希尔排序

【数据结构初阶】--排序(二)--直接选择排序,堆排序

【数据结构初阶】--排序(三):冒泡排序,快速排序

【数据结构初阶】--排序(四):归并排序

【数据结构初阶】--排序(五)--计数排序,排序算法复杂度对比和稳定性分析

结语:本篇博客就到此结束了,大家如果是快速排序掌握的还可以的话,可以好好学习一下这篇博客中的一些优化的方法,如果时间不够或者之前掌握的不牢固的可以先放一放,后续再来学习,如果文章对你有帮助的话,欢迎评论,点赞,收藏加关注,感谢大家的支持。


网站公告

今日签到

点亮在社区的每一天
去签到