🏀🏀🏀来都来了,不妨点个关注!
🎧🎧🎧博客主页:欢迎各位大佬!
文章目录
1 排序
1.1 排序的概念
排序:所谓排序,就是将一串数据,按照其中某个或某些关键字的大小,递增或递减排列起来的操作。
稳定性:将一串数据经过某种排序后,其相同关键字的相对序列仍保持原有的次序。
1.2 几种常见的排序算法:
插入排序:将待排序的值插入到前面已经有序的序列中
选择排序:每次排序选出序列的最大值(或最小值)放到序列的最后面
交换排序:两两比较待排序的序列,并交换不满足序列的那对数
2 常见排序算法的实现
2.1 插入排序
2.1.1直接插入排序:
基本思想:将待排序的值与其前面已排序的值逐个进行比较插入。 我们日常生活中,打扑克牌的时候就有直接插入排序的思想。当我们摸了一张牌后,会将它与前面已经插入进来的数字进行比较,进行插入。
代码实现如下:
/**
* 时间复杂度O(n^2)
* 最好的情况下时间复杂度:O(n)
* 当数据基本有序时,直接插入排序速度很快
* 一般使用场景就是,数据基本趋于有序,建议使用直接插入排序
*
* 空间复杂度O(1)
* 稳定性:稳定
* @param array
*/
public static void insertSort(int[] array) {
for (int i = 1; i < array.length; i++) {
int j = i-1;
int tmp = array[i];
while (j != -1) {
if (array[j] > tmp) {
array[j+1] = array[j];
j--;
} else {
//array[j+1] = tmp;
break;
}
}
array[j+1] = tmp;
}
}
相关特性总结:
时间复杂度:O(n^2) 当数据本身有序时,时间复杂度:O(n)
空间复杂度:O(1)
稳定性:稳定
应用场景:数据基本趋于有序,建议使用直接插入排序
2.1.2 希尔排序:
基本思想:希尔排序又称为缩小增量法,希尔排序的基本思想就是:先选定一个整数gap,将待排数据分为多个组,所有距离为gap的组为一组,然后每组里面进行排序,然后gap/2,再进行排序,依次类推,当gap=1时,所有数据已经排好序。
简单理解就是按gap分组,然后分组内进行插入排序,当gap=1时,就是直接插入排序。
代码实现:
public static void shellSort(int[] array) {
int gap = array.length;
while(gap > 1) {
shell(array,gap);
gap /= 2;
}
shell(array,1);
}
/**
* 时间复杂度: O(n^1.3)-O(n^1.5)
* 空间复杂度:O(1)
* 稳定性:不稳定
* @param array
* @param gap
*/
public static void shell(int[] array,int gap) {
for (int i = gap; i < array.length; i++) {
int j = i - gap;
int tmp = array[i];
while (j >= 0) {
if (array[j] > tmp) {
array[j+gap] = array[j];
j -= gap;
} else {
array[j+gap] = tmp;
break;
}
}
array[j+gap] = tmp;
}
}
特性总结:
时间复杂度:O(n^1.3) - O(n^1.5)
空间复杂度:O(1)
稳定性:不稳定
希尔排序是直接插入排序的优化:gap>1的排序是预排序,使数据趋于有序,gap=1时就是直接插入排序
2.2 选择排序:
2.2.1 选择排序
基本思想:每一次从待排序序列中选出最小或(最大)的元素,放在序列的起始位置,直到全部待排序数据排完。
这里我们的思路是,定义一个minIndex下标用来存储最小值的下标,第一次minIndex为0下标,然后遍历整个待排序序列,当有更小的数据时更新minIndex下标。最后在交换起始位置和minIndex下标的值。下面是代码实现。
/**
* 时间复杂度:O(n^2)
*空间复杂度:O(1)
* 稳定性:不稳定
* @param array
*/
public static void selectSort(int[] array) {
for (int i = 0; i < array.length; i++) {
int minIndex = i;
for (int j = i + 1; j < array.length; j++) {
if (array[j] < array[minIndex]) {
minIndex = j; //更新minIndex下标
}
}
swap(array,i,minIndex);
}
}
public static void swap(int[] array,int i, int j) {
int tmp = array[i];
array[i] = array[j];
array[j] = tmp;
}
特性总结:
时间复杂度:O(n^2)
空间复杂度:O(1)
稳定性:不稳定
2.2.2 堆排序
基本思想:堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆,排降序建小堆
堆排序就是先将我们的数组进行一次建堆,然后循环交互堆顶元素(最大值)与最后一个元素,即交换数组头和尾的元素,然后重新建堆,然后进行交换堆顶元素与最后一个元素,其中我们的最后一个元素是从数组长度进行递减的。如图:
这里演示的第一次交换。
/**
* 堆排序
* 时间复杂度: O(n*logn)
* 空间复杂度:O(1)
* 稳定性:不稳定
* @param array
*/
public static void heapSort(int[] array) {
createBigHeap(array);
int end = array.length - 1;
while (end > 0) {
swap(array,0,end);
shiftDown(array,0,end);
end--;
}
}
public static void createBigHeap(int[] array) {
for (int parent = (array.length-1-1) / 2; parent >= 0; parent--) {
shiftDown(array,parent,array.length);
}
}
//建大堆
private static void shiftDown(int[] array, int parent, int len) {
int child = 2 * parent + 1;
while (child < len) {
if (child +1 < len && array[child] < array[child+1]) {
child++;
}
if (array[child] > array[parent]) {
swap(array,child,parent);
parent = child;
child = 2 * parent + 1;
} else {
break;
}
}
相关特性总结:
- 堆排序使用堆来选数,效率就高了很多。
- 时间复杂度:O(N*logN)
- 空间复杂度:O(1)
- 稳定性:不稳定
2.3 交换排序
2.3.1 冒泡排序
基本思想:交换排序的基本思想就是将序列中两个数据进行比较,按比较结果来交换序列位置。交换排序的特点是:将键值较大的数据放到序列的尾部位置,将键值较小的数据 放到序列的首部位置。
下面我们先看代码演示:
/**
* 时间复杂度:O(n^2)
*空间复杂度:O(1)
* 稳定性:稳定
* @param array
*/
public static void bubbleSort(int[] array) {
for (int i = 0; i < array.length-1; i++) {
boolean flg = false;
for (int j = 0; j < array.length - 1 - i; j++) {
if (array[j] > array[j+1]) {
swap(array,j,j+1);
flg = true;
}
}
if (flg == false) {
return ;
}
}
}
注意:
冒泡排序的每一次循环比较是找出最大值或(最小值),将最大值或(最小值)放在尾部(首部)位置。
经过n次比较后,数据变成有序的。
优化:当数据本身是有序的时候,我们可以定义一个flg进行判断,如果一次交换都没有,则表明序列已经有序,直接返回。
相关特性总结:
时间复杂度:O(n^2)
空间复杂度:O(1)
稳定性:稳定
2.3.2 快速排序
基本思想:任取待排序序列中的一个元素作为基准值,按照该基准将待排序序列分为两个序列,左子序列的元素值都小于该基准值,右子序列的元素值都大于该基准值。然后在左右子序列中重复该过程,直到所有元素在相应的位置上。
主体框架:
// 假设按照升序对array数组中[left, right]区间中的元素进行排序
public void quickSort(int[] nums) {
int left = 0;
int right = nums.length - 1;
quick(nums,left,right);
}
public void quick(int[] array, int left, int right)
{
if(left >= right)
return;
// 按照基准值对array数组的 [left, right]区间中的元素进行划分
int pivot = partion(array, left, right);
// 划分成功后以pivot为边界形成了左右两部分 [left, pivot-1] 和 [pivot+1, right)
// 递归排[left, pivot - 1)
quick(array, left, pivot - 1);
// 递归排[pivot + 1, right)
quick(array, pivot+1, right);
}
上面是快排的主框架,我们不难看出,这和二叉树的前序遍历(递归实现)的很像,所以当我们写快排的时候可以联想下二叉树的前序遍历是怎么写的。接下来我们就介绍下找基准值的方法,在快排中有以下几种找基准的方法:
2.3.2.1 hoare法
步骤:
① 先取最左侧的值为基准值
②让right指针从最右侧开始往前走,找到比基准值小的元素停下,left指针从最左侧开始往后走,找到比基准值大的元素停下。交换left下标和right下标的值。
③当left>=right的时候循环停下,即找到了基准值的对应下标,此时交换基准值初始下标和此时的下标即left(或right)的值即可。
代码实现:
//hoare法
public static int partition(int[] array,int left,int right) {
int tmp = array[left];
int i = left;
while (left < right) {
//找到比基准值大的元素
while (left < right && array[right] >= tmp) {
right--;
}
//找到比基准值小的元素
while (left < right && array[left] <= tmp) {
left++;
}
//交换这两个元素
swap(array,left,right);
}
swap(array,left,i);
return left;
}
hoare法,是定义两个标志位,right从右往左找到比基准值小的值停下来,然后left从左往右找到比基准值大的值停下来,交换left位置和right位置的值,然后循环继续,直到left和right相遇,最后再交换基准值和相遇处的值。再对左右子序列重复此过程,直到数据变成有序。下面,我们用图演示。
2.3.2.2 挖坑法
步骤:
①取最左侧的元素为基准值
②right下标从序列最右侧开始往前遍历找到比基准值小的下标停下,将left下标处的值赋值为right下标的值,left下标从序列最左侧开始往后遍历找到比基准值大的下标停下,将right下标处的值赋值为left下标的值,如此循环。
③当left>=right时,将left(或right)下标的值赋值为基准值
代码实现:
//挖坑法
public static int partition(int[] array,int left,int right) {
int tmp = array[left];
while (left < right) {
while (left < right && array[right] >= tmp) {
right--;
} //找到比tmp小的下标
array[left] = array[right];
while (left < right && array[left] <= tmp) {
left++;
} //找到比tmp大的下标
array[right] = array[left];
}
array[left] = tmp;
return left;
}
下面我们用图演示。
第三种方法是前后指针法,这个方法了解即可。
//前后指针法 【了解即可】
private static int partition3(int[] array,int left,int right) {
int prev = left ;
int cur = left+1;
while (cur <= right) {
if(array[cur] < array[left] && array[++prev] != array[cur]) {
swap(array,cur,prev);
}
cur++;
}
swap(array,prev,left);
return prev;
}
2.3.2.3 快排的优化:
因为快排的基准是随机取的,一般情况下,快排的时间复杂度为nlog(n),当一些情况下会变成O(n^2),比如数据本身是有序的,为1,2,3,,4…。
这里我们可以用二叉树来理解,
一般情况下,基准到达对应的位置后,序列被分为了左右子序列,此时时间复杂度为O(nlog(n))。但也有特殊情况,如下:
当我们只有一个分支的时候,此时树的高度就是结点的个数,此时的时间复杂度变为了O(n^2)。而当数据量足够大的时候,比如100万,此时我们上述的代码就跑不过了。
优化方法:
1.三数取中法:
我们可以取left,right,和mid中第二大的值为基准进行快排,这样就不会出现,所有数据都在一个子序列上的情况了。
public static void quick(int[] array,int start,int end) {
if (start >= end) {
return ;
}
int index = midThree(array,start,end);
swap(array,start,index);
int pivot = partition1(array,start,end);
quick(array,start,pivot - 1);
quick(array,pivot + 1,end);
}
private static int midThree(int[] array,int left,int right) {
int mid = (left+right) / 2;
if(array[left] < array[right]) {
if(array[mid] < array[left]) {
return left;
}else if(array[mid] > array[right]) {
return right;
}else {
return mid;
}
}else {
//array[left] > array[right]
if(array[mid] < array[right]) {
return right;
}else if(array[mid] > array[left]) {
return left;
}else {
return mid;
}
}
}
2.递归到小的子区间时用插入排序:
我们知道当递归到较小的区间的时候,数据是渐渐趋于有序的,而我们在上面说过,当数据趋于有序的时候,建议使用直接插入排序。这样效率比较高。在java底层中是当子区间小于47的时候使用直接插入排序
特性总结:
时间复杂度:O(N*logN)
空间复杂度:O(logN)
稳定性:不稳定
快排整体的综合性能和应用场景都是比较好的,所以才敢叫快速排序。
2.3.3 快排的非递归实现
//非递归实现快排
public static void quickSort1(int[] array) {
Deque<Integer> stack = new LinkedList<>();
int left = 0;
int right = array.length - 1;
int pivot = partition(array,left,right);
if (pivot > left + 1) {
stack.push(left);
stack.push(pivot - 1);
}
if (pivot < right-1) {
stack.push(pivot+1);
stack.push(right);
}
while (!stack.isEmpty()) {
right = stack.pop();
left = stack.pop();
pivot = partition(array,left,right);
if (pivot > left + 1) {
stack.push(left);
stack.push(pivot - 1);
}
if (pivot < right-1) {
stack.push(pivot+1);
stack.push(right);
}
}
}
2.4 归并排序
2.4.1 基本思想
归并排序是建立在归并操作上的一种有效的算法,该算法是分治法的一种典型应用。将已有序的子序列合并,得到完全有序的序列:即先使每个子序列有序,再使子序列段间有序,最后将两个有序表合并为一个有序表,称为二路归并。
我们先上图理解:
2.4.2 递归实现归并排序
代码实现:
//归并排序
public static void mergeSort(int[] array) {
mergeSortFunc(array,0,array.length-1);
}
//分解
public static void mergeSortFunc(int[] array,int left,int right) {
if (left >= right) {
return ;
}
int mid = (left + right) / 2;
mergeSortFunc(array,left,mid);
mergeSortFunc(array,mid+1,right);
merge(array,left,right,mid);
}
//归并
public static void merge(int[] array,int start,int end,int mid) {
int s1 = start;
//int e1 = mid;
int s2 = mid+1;
//int e2 = end;
int[] tmp = new int[end-start+1];
int k = 0;//tmp数组的下标
while (s1 <= mid && s2 <= end) {
if(array[s1] <= array[s2]) {
tmp[k++] = array[s1++];
}else {
tmp[k++] = array[s2++];
}
}
while (s1 <= mid) {
tmp[k++] = array[s1++];
}
while (s2 <= end) {
tmp[k++] = array[s2++];
}
for (int i = 0; i < tmp.length; i++) {
array[i+start] = tmp[i];
}
}
特性总结:
时间复杂度:O(N*logN)
空间复杂度:O(N)
稳定性:稳定
应用场景:当待排序数据特别大时,比如内存只有1G,而要排序的数据有100G,此时我们可以将待处理的数据分为200份,每份512M,利用归并排序分别对这512M的数据进行排序,然后同时进行二路归并。最后数据变为有序。所以归并排序用于解决磁盘中的外排序问题。
好了,写到这里,排序这一章节就结束了。感谢支持!