数据结构-排序

发布于:2025-03-20 ⋅ 阅读:(15) ⋅ 点赞:(0)

1. 排序的概念

排序: 所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。
稳定性: 假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的。
内部排序: 数据元素全部放在内存中的排序。
外部排序: 数据元素太多不能同时放在内存中,根据排序过程的要求不能在内外存之间移动数据的排序。

常见的排序算法有以下 7类

排序类别

2. 常见排序算法的实现

2.1 插入排序

1)插入排序

一)基本思想

把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中,直到所有的记录插入完为止,得到一个新的有序序列 。

插入排序

二)特性及时间复杂度

元素集合越接近有序,直接插入排序算法的时间效率越高

时间复杂度: O(N^2),最好的情况【顺序有序】:O(N)

空间复杂度: O(1),它是一种稳定的排序算法

稳定性: 稳定

三)代码实现
void InsertSort(int* a, int n)
{
	for (int i = 0; i < n - 1; ++i)
	{
		int end = i;
		// a[0]不需要排序
		int tmp = a[end + 1];
		while (end >= 0)
		{
			if (a[end] > tmp)
			{
				a[end + 1] = a[end];
				--end;
			}
			else
			{
				break;
			}
		}
		a[end + 1] = tmp;
	}
}

2)希尔排序(缩小增量排序)

一)基本思想

先选定一个整数,把待排序文件中所有记录分成个组,所有距离为的记录分在同一组内,并对每一组内的记录进行排序。然后,取,重复上述分组和排序的工作。当到达=1时,所有记录在统一组内排好序。

希尔排序

二)特性及时间复杂度

希尔排序是对直接插入排序的优化。

gap > 1 时都是预排序,目的是让数组更接近于有序。当 gap == 1 时,数组已经接近有序的了,这样就会很快。这样整体而言,可以达到优化的效果。

希尔排序的时间复杂度不好计算,因为 gap 的取值方法很多,导致很难去计算,因此在好些书中给出的希尔排序的时间复杂度都不固定:

《数据结构(C语言版)》— 严蔚敏:

ywm

《数据结构-用面相对象方法与C++描述》— 殷人昆

yrk

因为下面的 gap 是按照Knuth提出的方式取值的,而且Knuth进行了大量的试验统计,大致估计为 O(N^1.3)

稳定性: 不稳定

三)代码实现

这里的 gap 取值才用 gap/3+1 的办法,让排序更快调用起来。

void ShellSort(int* a, int n)
{
	int gap = n;
	// gap > 1时是预排序,目的让他接近有序
	// gap == 1是直接插入排序,目的是让他有序
	while (gap > 1)
	{
		//gap = gap / 2 + 1;
		gap = gap / 3 + 1;
		for (int i = 0; i < n - gap; ++i)
		{
			int end = i;
			int tmp = a[end + gap];
			while (end >= 0)
			{
				if (a[end] > tmp)
				{
					a[end + gap] = a[end];
					end -= gap;
				}
				else
				{
					break;
				}
			}
			a[end + gap] = tmp;
		}
	}
}

2.2 选择排序

1)选择排序

一)基本思想

每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,直到全部待排序的数据元素排完 。

选择排序

二)特性及时间复杂度

直接选择排序效率不是很好,实际中很少使用

时间复杂度: O(N^2)

**空间复杂度: **O(1)

稳定性: 不稳定

三)代码实现

在上面的基础上,多增加一次交换,变成一次交换最大值和最小值分别到尾和头,同时,如果最大值就是在开头,会出现问题,因此加入判定 maxi == begin 要重新对 maxi 赋值。

void SelectSort(int* a, int n)
{
	int begin = 0, end = n - 1;
	while (begin < end)
	{
		int mini = begin, maxi = end;
		for (int i = begin; i < end; ++i)
		{
			if (a[i] < a[mini])
				mini = i;
			if (a[i] > a[maxi])
				maxi = i;
		}

		Swap(&a[begin], &a[mini]);
		if (maxi == begin)
			maxi = mini;
		Swap(&a[end], &a[maxi]);
		++begin;
		--end;
	}
}

2)堆排序

一)基本思想

堆排序(是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。它是通过堆来进行选择数据,需要注意的是排升序要建大堆,排降序建小堆。

堆排序

二)特性及时间复杂度

堆排序使用堆来选数,效率就高了很多

时间复杂度: O(NlogN)

空间复杂度: O(1)

稳定性: 不稳定

三)代码实现
void AdjustDown(int* a, int size, int parent)
{
	int child = parent * 2 + 1;
	while (child < size)
	{
		// > 是建大堆
		if (child + 1 < size && a[child + 1] > a[child])
		{
			child++;
		}

		// > 是建大堆
		if (a[child] > a[parent])
		{
			Swap(&a[child], &a[parent]);
			parent = child;
			child = parent * 2 + 1;
		}
		else
		{
			break;
		}
	}
}

void HeapSort(int* a, int n)
{
	// O(N)
	// 升序建大堆
	for (int i = (n - 1 - 1) / 2; i >= 0; --i)
	{
		AdjustDown(a, n, i);
	}
	//O(NlogN)
	int end = n - 1;
	while (end > 0)
	{
		Swap(&a[0], &a[end]);
		AdjustDown(a, end, 0);
		end--;
	}
}

2.3 交换排序

1)冒泡排序

一)基本思想

根据序列中两个记录键值的比较结果来对换这两个记录在序列中的位置,将键值较大的记录向序列的尾部移动,键值较小的记录向序列的前部移动。

冒泡排序

二)特性及时间复杂度

冒泡排序是一种非常容易理解的排序

**时间复杂度: ** O(N^2)

空间复杂度: O(1)

稳定性: 稳定

三)代码实现

这里加入一个判定 exchange 进行判定,如果在中间发现有序,即该趟排序没有发生交换,就意味着数组已经有序,因此直接结束循环。

void BubbleSort(int* a, int n)
{
	for (int j = 0; j < n; j++)
	{
		bool exchange = false;
		for (int i = 1; i < n - j; i++)
		{
			if (a[i - 1] > a[i])
			{
				Swap(&a[i - 1], &a[i]);
				exchange = true;
			}
		}

		if (exchange == false)
			break;
	}
}

2)快速排序

一)基本思想

任取待排序元素序列中的某元素作为基准值,按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右子序列中所有元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止。

二)特性及时间复杂度

快速排序整体的综合性能和使用场景都是比较好的

时间复杂度: O(NlogN)

空间复杂度: O(logN)

稳定性: 不稳定

三)代码实现

将区间按照基准值划分为左右两半部分的常见方式有3个版本

hoare版本

该思路采用递归分治的思想,比 key 小或相等的值到左边,比 key 大或相等的值到右边,最后将 key 交换到中间,形成以 key 为分界的一小一大区域。同时继续对这一小一大区域再次重复此过程(递归),直到 begin >= end 就停止递归。

为什么相遇位置比 key 小?

因为右边先走,这样就会形成两种情况:

1)R遇到L: R没有找到比 key 小的值,直到遇到L停止,相遇位置是L,会比 key

2)L遇到R: R先走,找到小的停下来,L找大,没有找到,遇到R停下来,相遇位置是R,会比 key

因此相遇位置总会比 key 小,从而交换后保持左小右大的规则。如果 key 是尾,那么L先走也是一致的。

为了使 key 随机性,从而获取更好的性能(排序顺序时时间复杂度显著降低),将按照常规的办法,取头尾中三个数字进行比较,取中间的值作为 key 并交换到头部开始递归。

int GetMidi(int* a, int begin, int end)
{
	int midi = (begin + end) / 2;

	int max =a[begin] > a[end] ? begin : end;
	max = a[max] > a[midi] ? max : midi;
	int min = a[begin] > a[end] ? end : begin;
	min = a[min] > a[midi] ? midi : min;

	return begin + end + midi - max - min;
}

这个版本实现快速排序有很多坑!!

首先是 leftright 的初始值,其次是左右循环条件要设为 <= 或者 >= ,同时要加入判定条件,不让数组越界,并且相遇就停止。条件错一个,那么结果都是错的。

hoare

// end为数组最大下标
void QuickSort(int* a, int begin, int end)
{
	if (begin >= end)
		return;

	int left = begin, right = end;

	int midi = GetMidi(a, begin, end);
	Swap(&a[midi], &a[begin]);
	int keyi = begin;

	while (left < right)
	{
		// 右边找小
		while (left < right && a[right] >= a[keyi])
		{
			--right;
		}
		// 左边找小
		while (left < right && a[left] <= a[keyi])
		{
			++left;
		}

		Swap(&a[left], &a[right]);
	}

	Swap(&a[keyi], &a[left]);

	QuickSort(a, begin, left - 1);
	QuickSort(a, left + 1, end);
}
挖坑法

该方法是对 hoare 的改进策略,先保存 key 的值,然后开始遍历(与 hoare 策略一致),右边R先走,找到一个比 key 小的值后,放入L的下标位置,然后L开始走,找到一个比 key 大的值后,放入到R的下标位置。相遇后,直接将 key 的值放入相遇位置。以此进行递归。

下面将一趟的代码分离,方便进行调用。

挖坑法

int PartSort2(int* a, int begin, int end)
{
	int left = begin, right = end;

	int midi = GetMidi(a, begin, end);
	Swap(&a[midi], &a[begin]);
	int key = a[begin];
	int hole = begin;

	while (left < right)
	{
		// 右边找小,填到左边的坑
		while (left < right && a[right] >= key)
		{
			--right;
		}
		a[hole] = a[right];
		hole = right;

		// 左边找大,填到右边的坑
		while (left < right && a[left] <= key)
		{
			++left;
		}
		a[hole] = a[left];
		hole = left;
	}

	a[hole] = key;

	return hole;
}

void QuickSort(int* a, int begin, int end)
{
	if (begin >= end)
		return;

	int keyi = PartSort2(a, begin, end);

	QuickSort(a, begin, keyi - 1);
	QuickSort(a, keyi + 1, end);
}
前后指针版本

因为 hoare 太多坑了,不方便使用,因此有人发明出前后指针的办法:

1)当 cur>key 时, ++cur

2)当 cur<key 时,++prev 然后交换 prevcur 的值,再 ++cur

3)当 cur>end 时,循环结束,交换 prevkeyi 的值,即最开始的值。

前后指针

int PartSort3(int* a, int begin, int end)
{
	int midi = GetMidi(a, begin, end);
	Swap(&a[midi], &a[begin]);
	int keyi = begin;

	int prev = begin;
	int cur = begin + 1;
	while (cur <= end)
	{
		if (a[cur] < a[keyi] && ++prev != cur)
			Swap(&a[prev], &a[cur]);

		++cur;
	}

	Swap(&a[prev], &a[keyi]);
	keyi = prev;
	return keyi;
}

void QuickSort(int* a, int begin, int end)
{
	if (begin >= end)
		return;

	int keyi = PartSort3(a, begin, end);

	QuickSort(a, begin, keyi - 1);
	QuickSort(a, keyi + 1, end);
}
非递归实现快排(利用栈)

这里要利用栈的特性,先把头位置放进栈,出栈就代表走一遍排序,然后可以拿到 keyi 的值,再将两边分别入栈,当 left < key-1 (表示不能等于自身或者大于自身)时,或者 right > keyi+1 (表示不能等于自身或者小于自身)时,重复此动作,直到结束。

这里不明确头尾哪个先入栈,但出栈顺序必须要匹配出栈的值

非递归实现快排

void QuickSortNonR(int* a, int begin, int end)
{
	ST s;
	STInit(&s);
	STPush(&s, end);
	STPush(&s, begin);

	while (!STEmpty(&s))
	{
		int left = STTop(&s);
		STPop(&s);
		int right = STTop(&s);
		STPop(&s);

		int keyi = PartSort3(a, left, right);
		if (left < keyi - 1)
		{
			STPush(&s, keyi - 1);
			STPush(&s, left);
		}
		if (right > keyi + 1)
		{
			STPush(&s, right);
			STPush(&s, keyi + 1);
		}
	}

	STDestroy(&s);
}

2.4 归并排序

1)基本思想

采用分治法的一个非常典型的应用,将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。

思想

2)特性及时间复杂度

归并的缺点在于需要O(N)的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。

时间复杂度: O(NlogN)

空间复杂度: O(N)

稳定性: 稳定

3)代码实现

递归思想

采用后递归的方法,先分解,在逐一合并

归并排序

void _MergeSort(int* a, int begin, int end, int* tmp)
{
	if (begin >= end)
		return;
	
	// 后序递归(分解)
	int midi = (begin + end) / 2;
	_MergeSort(a, begin, midi, tmp);
	_MergeSort(a, midi + 1, end, tmp);
	
	// [begin, midi][midi+1, end]合并(归并)
	// 区间各只有一个元素即有序,往上依次后序归并
	int begin1 = begin, end1 = midi;
	int begin2 = midi + 1, end2 = end;
	int i = begin;
	while (begin1 <= end1 && begin2 <= end2)
	{
		if (a[begin1] < a[begin2])
			tmp[i++] = a[begin1++];
		else
			tmp[i++] = a[begin2++];
	}
	while (begin1 <= end1)
	{
		tmp[i++] = a[begin1++];
	}
	while (begin2 <= end2)
	{
		tmp[i++] = a[begin2++];
	}

	memcpy(a + begin, tmp + begin, sizeof(int) * (end - begin + 1));
}

void MergeSort(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		perror("malloc fail\n");
		exit(-1);
	}

	_MergeSort(a, 0, n - 1, tmp);
}
非递归实现归并

这个思路就是,首先将 gap=1 ,即拆分成最小单位,之后就是完成一趟一趟的归并,每一趟结束后将 gap*2 ,就控制归并的组别。

这里需要注意的是,要防止 end1/begin2/end2 越界,因此对其进行判定。其次每排完一次都要进行 memcpy 操作,不然的话没有更新到原数组,后面的( gap 增加后)排序就可能会出错。

非递归归并

void MergeSortNonR(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		perror("malloc fail\n");
		exit(-1);
	}

	int gap = 1;
	while (gap < n)
	{
		for (int i = 0; i < n - gap; i += gap * 2)
		{
			int begin1 = i, end1 = i + gap - 1;
			int begin2 = i + gap, end2 = i + gap * 2 - 1;

			// 防止越界
			if (end1 >= n || begin2 >= n)
				return;
			if (end2 >= n)
				end2 = n - 1;

			int k = i;
			while (begin1 <= end1 && begin2 <= end2)
			{
				if (a[begin1] < a[begin2])
					tmp[k++] = a[begin1++];
				else
					tmp[k++] = a[begin2++];
			}
			while (begin1 <= end1)
			{
				tmp[k++] = a[begin1++];
			}
			while (begin2 <= end2)
			{
				tmp[k++] = a[begin2++];
			}

			memcpy(a + i, tmp + i, sizeof(int) * (end2 - i + 1));
		}
		gap *= 2;
	}

	free(tmp);
}

3. 非比较排序(计数排序)

3.1 思想

计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用。 操作步骤:

1)统计相同元素出现次数

2)根据统计的结果将序列回收到原来的序列中

计数排序

3.2 特性及时间复杂度

计数排序在数据范围集中时,效率很高,但是适用范围及场景有限,不适合分散的数据,不适合浮点数、字符串、结构体数据排序,只适合整数

时间复杂度O(MAX(N,范围))

**空间复杂度: ** O(范围)

稳定性: 稳定

3.3 代码实现

void CountSort(int* a, int n)
{
	int min = a[0], max = a[0];
	for (int i = 1; i < n; ++i)
	{
		if (min > a[i])
			min = a[i];
		if (max < a[i])
			max = a[i];
	}

	int range = max - min + 1;
	int* count = (int*)calloc(range, sizeof(int));
	if (count == NULL)
	{
		perror("ralloc fail\n");
		exit(-1);
	}
	for (int i = 0; i < n; ++i)
	{
		// 相对映射统计a数组中每个数据出现的次数
		count[a[i] - min]++;
	}

	int j = 0;
	for (int i = 0; i < range; ++i)
	{
		while (count[i]--)
		{
			a[j++] = i + min;
		}
	}

	free(count);
}

4. 排序算法复杂度及稳定性分析

对每个算法进行分析:

分析1

分析2

以上就是排序的全部内容啦!