【数据结构】之排序

发布于:2024-09-17 ⋅ 阅读:(54) ⋅ 点赞:(0)

🏀🏀🏀来都来了,不妨点个关注!
🎧🎧🎧博客主页:欢迎各位大佬!
在这里插入图片描述

1 排序

1.1 排序的概念

排序:所谓排序,就是将一串数据,按照其中某个或某些关键字的大小,递增或递减排列起来的操作。
稳定性:将一串数据经过某种排序后,其相同关键字的相对序列仍保持原有的次序。

1.2 几种常见的排序算法:

在这里插入图片描述

插入排序:将待排序的值插入到前面已经有序的序列中
选择排序:每次排序选出序列的最大值(或最小值)放到序列的最后面
交换排序:两两比较待排序的序列,并交换不满足序列的那对数

2 常见排序算法的实现

2.1 插入排序

2.1.1直接插入排序:

基本思想:将待排序的值与其前面已排序的值逐个进行比较插入。 我们日常生活中,打扑克牌的时候就有直接插入排序的思想。当我们摸了一张牌后,会将它与前面已经插入进来的数字进行比较,进行插入。
在这里插入图片描述
代码实现如下:

/**
     * 时间复杂度O(n^2)
     *    最好的情况下时间复杂度:O(n)
     *     当数据基本有序时,直接插入排序速度很快
     *      一般使用场景就是,数据基本趋于有序,建议使用直接插入排序
     *
     *     空间复杂度O(1)
     *     稳定性:稳定
     * @param array
     */
    public static void insertSort(int[] array) {
        for (int i = 1; i < array.length; i++) {
            int j = i-1;
            int tmp = array[i];
            while (j != -1) {
                if (array[j] > tmp) {
                    array[j+1] = array[j];
                    j--;
                } else {
                    //array[j+1] = tmp;
                    break;
                }
            }
            array[j+1] = tmp;
        }
    }

相关特性总结:

时间复杂度:O(n^2) 当数据本身有序时,时间复杂度:O(n)
空间复杂度:O(1)
稳定性:稳定
应用场景:数据基本趋于有序,建议使用直接插入排序

2.1.2 希尔排序:

基本思想:希尔排序又称为缩小增量法,希尔排序的基本思想就是:先选定一个整数gap,将待排数据分为多个组,所有距离为gap的组为一组,然后每组里面进行排序,然后gap/2,再进行排序,依次类推,当gap=1时,所有数据已经排好序。
简单理解就是按gap分组,然后分组内进行插入排序,当gap=1时,就是直接插入排序。

在这里插入图片描述

代码实现:


 public static void shellSort(int[] array) {
        int gap = array.length;
        while(gap > 1) {
            shell(array,gap);
            gap /= 2;
        }
        shell(array,1);
    }

    /**
     * 时间复杂度: O(n^1.3)-O(n^1.5)
     * 空间复杂度:O(1)
     * 稳定性:不稳定
     * @param array
     * @param gap
     */
    public static void shell(int[] array,int gap) {
        for (int  i = gap; i < array.length; i++) {
            int j = i - gap;
            int tmp = array[i];
            while (j >= 0) {
                if (array[j] > tmp) {
                    array[j+gap] = array[j];
                    j -= gap;
                } else {
                    array[j+gap] = tmp;
                    break;
                }
            }
            array[j+gap] = tmp;
        }
    }

特性总结:

时间复杂度:O(n^1.3) - O(n^1.5)
空间复杂度:O(1)
稳定性:不稳定
希尔排序是直接插入排序的优化:gap>1的排序是预排序,使数据趋于有序,gap=1时就是直接插入排序

2.2 选择排序:

2.2.1 选择排序

基本思想:每一次从待排序序列中选出最小或(最大)的元素,放在序列的起始位置,直到全部待排序数据排完。
这里我们的思路是,定义一个minIndex下标用来存储最小值的下标,第一次minIndex为0下标,然后遍历整个待排序序列,当有更小的数据时更新minIndex下标。最后在交换起始位置和minIndex下标的值。下面是代码实现。

/**
     * 时间复杂度:O(n^2)
     *空间复杂度:O(1)
     * 稳定性:不稳定
     * @param array
     */
    public static void selectSort(int[] array) {
        for (int i = 0; i < array.length; i++) {
            int minIndex = i;
            for (int j = i + 1; j < array.length; j++) {
                if (array[j] < array[minIndex]) {
                    minIndex = j; //更新minIndex下标
                }
            }
            swap(array,i,minIndex);
        }
    }
    public static void swap(int[] array,int i, int j) {
          int tmp  = array[i];
          array[i] = array[j];
          array[j] = tmp;
    }

特性总结:

时间复杂度:O(n^2)
空间复杂度:O(1)
稳定性:不稳定

2.2.2 堆排序

基本思想:堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆,排降序建小堆
堆排序就是先将我们的数组进行一次建堆,然后循环交互堆顶元素(最大值)与最后一个元素,即交换数组头和尾的元素,然后重新建堆,然后进行交换堆顶元素与最后一个元素,其中我们的最后一个元素是从数组长度进行递减的。如图:
在这里插入图片描述
在这里插入图片描述
这里演示的第一次交换。

/**
     * 堆排序
     * 时间复杂度: O(n*logn)
     * 空间复杂度:O(1)
     * 稳定性:不稳定
     * @param array
     */
    public static void heapSort(int[] array) {
         createBigHeap(array);
         int end  = array.length - 1;
         while (end > 0) {
             swap(array,0,end);
             shiftDown(array,0,end);
             end--;
         }

    }

    public static void createBigHeap(int[] array) {
        for (int parent = (array.length-1-1) / 2; parent >= 0; parent--) {
            shiftDown(array,parent,array.length);
        }
    }
   //建大堆
    private static void shiftDown(int[] array, int parent, int len) {
        int child = 2 * parent + 1;
        while (child < len) {
            if (child +1 < len && array[child] < array[child+1]) {
                child++;
            }
            if (array[child] > array[parent]) {
                swap(array,child,parent);
                parent = child;
                child = 2 * parent + 1;
            } else {
                break;
            }
        }

相关特性总结:

  1. 堆排序使用堆来选数,效率就高了很多。
  2. 时间复杂度:O(N*logN)
  3. 空间复杂度:O(1)
  4. 稳定性:不稳定

2.3 交换排序

2.3.1 冒泡排序

基本思想:交换排序的基本思想就是将序列中两个数据进行比较,按比较结果来交换序列位置。交换排序的特点是:将键值较大的数据放到序列的尾部位置,将键值较小的数据 放到序列的首部位置。
下面我们先看代码演示:

/**
     * 时间复杂度:O(n^2)
     *空间复杂度:O(1)
     * 稳定性:稳定
     * @param array
     */
public static void bubbleSort(int[] array) {
        for (int i = 0; i < array.length-1; i++) {
          boolean flg  =  false;
            for (int j = 0; j  < array.length - 1 - i; j++) {
                if (array[j] > array[j+1]) {
                    swap(array,j,j+1);
                    flg = true;
                }
            }
            if (flg == false) {
            return ;
            }
        }
    }

注意:

冒泡排序的每一次循环比较是找出最大值或(最小值),将最大值或(最小值)放在尾部(首部)位置。
经过n次比较后,数据变成有序的。
优化:当数据本身是有序的时候,我们可以定义一个flg进行判断,如果一次交换都没有,则表明序列已经有序,直接返回。

相关特性总结:

时间复杂度:O(n^2)
空间复杂度:O(1)
稳定性:稳定

2.3.2 快速排序

基本思想:任取待排序序列中的一个元素作为基准值,按照该基准将待排序序列分为两个序列,左子序列的元素值都小于该基准值,右子序列的元素值都大于该基准值。然后在左右子序列中重复该过程,直到所有元素在相应的位置上。
主体框架:

// 假设按照升序对array数组中[left, right]区间中的元素进行排序
public void quickSort(int[] nums) {
    int left = 0;
    int right = nums.length - 1;
    quick(nums,left,right);
}
public void quick(int[] array, int left, int right)
{
  if(left >= right)
    return;
 
  // 按照基准值对array数组的 [left, right]区间中的元素进行划分
  int pivot = partion(array, left, right);
 
  // 划分成功后以pivot为边界形成了左右两部分 [left, pivot-1] 和 [pivot+1, right)
  // 递归排[left, pivot - 1)
  quick(array, left, pivot - 1);
 
  // 递归排[pivot + 1, right)
  quick(array, pivot+1, right);
}

上面是快排的主框架,我们不难看出,这和二叉树的前序遍历(递归实现)的很像,所以当我们写快排的时候可以联想下二叉树的前序遍历是怎么写的。接下来我们就介绍下找基准值的方法,在快排中有以下几种找基准的方法:

2.3.2.1 hoare法

步骤:

① 先取最左侧的值为基准值
②让right指针从最右侧开始往前走,找到比基准值小的元素停下,left指针从最左侧开始往后走,找到比基准值大的元素停下。交换left下标和right下标的值。
③当left>=right的时候循环停下,即找到了基准值的对应下标,此时交换基准值初始下标和此时的下标即left(或right)的值即可。

代码实现:

   //hoare法
   public static int partition(int[] array,int left,int right) {
           int tmp = array[left];
           int i = left;
           while (left < right) {
                //找到比基准值大的元素
               while (left < right && array[right] >= tmp) {
                   right--;
               }
               //找到比基准值小的元素
               while (left < right && array[left] <= tmp) {
                   left++;
               }
               //交换这两个元素
               swap(array,left,right);
           }
           swap(array,left,i);
           return left;
   }

hoare法,是定义两个标志位,right从右往左找到比基准值小的值停下来,然后left从左往右找到比基准值大的值停下来,交换left位置和right位置的值,然后循环继续,直到left和right相遇,最后再交换基准值和相遇处的值。再对左右子序列重复此过程,直到数据变成有序。下面,我们用图演示。
在这里插入图片描述

2.3.2.2 挖坑法

步骤:

①取最左侧的元素为基准值
②right下标从序列最右侧开始往前遍历找到比基准值小的下标停下,将left下标处的值赋值为right下标的值,left下标从序列最左侧开始往后遍历找到比基准值大的下标停下,将right下标处的值赋值为left下标的值,如此循环。
③当left>=right时,将left(或right)下标的值赋值为基准值

代码实现:

   //挖坑法
   public static int partition(int[] array,int left,int right) {
        int tmp = array[left];
        while (left < right) {
           while (left < right && array[right] >= tmp) {
               right--;
           } //找到比tmp小的下标
            array[left]  = array[right];
           while (left < right && array[left] <= tmp) {
               left++;
           } //找到比tmp大的下标
           array[right] = array[left];
       }
        array[left] = tmp;
        return  left;
   }

下面我们用图演示。
在这里插入图片描述

第三种方法是前后指针法,这个方法了解即可。

//前后指针法 【了解即可】
    private static int partition3(int[] array,int left,int right) {
        int prev = left ;
        int cur = left+1;
        while (cur <= right) {
            if(array[cur] < array[left] && array[++prev] != array[cur]) {
                swap(array,cur,prev);
            }
            cur++;
        }
        swap(array,prev,left);
        return prev;
    }
2.3.2.3 快排的优化:

因为快排的基准是随机取的,一般情况下,快排的时间复杂度为nlog(n),当一些情况下会变成O(n^2),比如数据本身是有序的,为1,2,3,,4…。
这里我们可以用二叉树来理解,
在这里插入图片描述
一般情况下,基准到达对应的位置后,序列被分为了左右子序列,此时时间复杂度为O(n
log(n))。但也有特殊情况,如下:
在这里插入图片描述
当我们只有一个分支的时候,此时树的高度就是结点的个数,此时的时间复杂度变为了O(n^2)。而当数据量足够大的时候,比如100万,此时我们上述的代码就跑不过了。
优化方法:
1.三数取中法:
我们可以取left,right,和mid中第二大的值为基准进行快排,这样就不会出现,所有数据都在一个子序列上的情况了。

 public static void quick(int[] array,int start,int end) {
        if (start >= end) {
            return ;
        }
        int index = midThree(array,start,end);
        swap(array,start,index);
        int pivot = partition1(array,start,end);

        quick(array,start,pivot - 1);
        quick(array,pivot + 1,end);
   }
    private static int midThree(int[] array,int left,int right) {
        int mid = (left+right) / 2;
        if(array[left] < array[right]) {
            if(array[mid] < array[left]) {
                return left;
            }else if(array[mid] > array[right]) {
                return right;
            }else {
                return mid;
            }
        }else {
            //array[left] > array[right]
            if(array[mid] < array[right]) {
                return right;
            }else if(array[mid] > array[left]) {
                return left;
            }else {
                return mid;
            }
        }

    }

2.递归到小的子区间时用插入排序:
我们知道当递归到较小的区间的时候,数据是渐渐趋于有序的,而我们在上面说过,当数据趋于有序的时候,建议使用直接插入排序。这样效率比较高。在java底层中是当子区间小于47的时候使用直接插入排序
特性总结:

时间复杂度:O(N*logN)
空间复杂度:O(logN)
稳定性:不稳定
快排整体的综合性能和应用场景都是比较好的,所以才敢叫快速排序。

2.3.3 快排的非递归实现

//非递归实现快排
    public static void quickSort1(int[] array) {
        Deque<Integer> stack = new LinkedList<>();
         int left = 0;
         int right = array.length - 1;
         int pivot = partition(array,left,right);
         if (pivot > left + 1) {
             stack.push(left);
             stack.push(pivot - 1);
         }
         if (pivot < right-1) {
             stack.push(pivot+1);
             stack.push(right);
         }
         while (!stack.isEmpty()) {
              right = stack.pop();
              left = stack.pop();
              pivot = partition(array,left,right);
             if (pivot > left + 1) {
                 stack.push(left);
                 stack.push(pivot - 1);
             }
             if (pivot < right-1) {
                 stack.push(pivot+1);
                 stack.push(right);
             }
         }
    }

2.4 归并排序

2.4.1 基本思想

归并排序是建立在归并操作上的一种有效的算法,该算法是分治法的一种典型应用。将已有序的子序列合并,得到完全有序的序列:即先使每个子序列有序,再使子序列段间有序,最后将两个有序表合并为一个有序表,称为二路归并。
我们先上图理解:
在这里插入图片描述

2.4.2 递归实现归并排序

代码实现:

//归并排序
    public static void mergeSort(int[] array) {
          mergeSortFunc(array,0,array.length-1);
    }
    //分解
    public static void mergeSortFunc(int[] array,int left,int right) {
        if (left >= right) {
            return ;
        }
        int mid = (left + right) / 2;
        mergeSortFunc(array,left,mid);
        mergeSortFunc(array,mid+1,right);
        merge(array,left,right,mid);
    }
   //归并
    public static void merge(int[] array,int start,int end,int mid) {
        int s1 = start;
        //int e1 = mid;
        int s2 = mid+1;
        //int e2 = end;
        int[] tmp = new int[end-start+1];
        int k = 0;//tmp数组的下标
        while (s1 <= mid && s2 <= end) {
            if(array[s1] <= array[s2]) {
                tmp[k++] = array[s1++];
            }else {
                tmp[k++] = array[s2++];
            }
        }
        while (s1 <= mid) {
            tmp[k++] = array[s1++];
        }
        while (s2 <= end) {
            tmp[k++] = array[s2++];
        }

        for (int i = 0; i < tmp.length; i++) {
            array[i+start] = tmp[i];
        }
    }

特性总结:

时间复杂度:O(N*logN)
空间复杂度:O(N)
稳定性:稳定
应用场景:当待排序数据特别大时,比如内存只有1G,而要排序的数据有100G,此时我们可以将待处理的数据分为200份,每份512M,利用归并排序分别对这512M的数据进行排序,然后同时进行二路归并。最后数据变为有序。所以归并排序用于解决磁盘中的外排序问题。

好了,写到这里,排序这一章节就结束了。感谢支持!