java排序算法
zzzgd816 人气:01.插入排序
这个打麻将或者打扑克的很好理解, 比如有左手有一副牌1,2,4,7 ,来一张3的牌, 是不是就是手拿着这张牌从右往左插到2,4之间
一次插入排序的操作过程:
将待插元素,依次与已排序好的子数列元素从后到前进行比较,如果当前元素值比待插元素值大,则将移位到与其相邻的后一个位置,否则直接将待插元素插入当前元素相邻的后一位置,因为说明已经找到插入点的最终位置
public class InsertSort { public static void sort(int[] arr) { if (arr.length >= 2) { for (int i = 1; i < arr.length; i++) { //挖出一个要用来插入的值,同时位置上留下一个可以存新的值的坑 int x = arr[i]; int j = i - 1; //在前面有一个或连续多个值比x大的时候,一直循环往前面找,将x插入到这串值前面 while (j >= 0 && arr[j] > x) { //当arr[j]比x大的时候,将j向后移一位,正好填到坑中 arr[j + 1] = arr[j]; j--; } //将x插入到最前面 arr[j + 1] = x; } } } }
2.分治排序法,快速排序法
简单的说, 就是设置一个标准值, 将大于这个值的放到右边(不管排序), 将小于这个值的放到左边(不管排序), 那么这样只是区分了左小右大, 没有排序, 没关系, 左右两边再重复这个步骤.直到不能分了为止.
详细说就是:
- 选择待排数列的首部第一个元素为基准元素x,设置两指针,分别指向数列首尾部位置,假设两指针分别设为i和j。
- 每次遍历的过程是这样的,首先从右到左遍历指针j所指向的元素,直到j指向的元素值小于基准元素x时,停止遍历,将其放到i的位置(因为i的值已经拷贝成了基准x腾出了位置)
- i往右挪一步, i++,接着轮到指针i从左到右遍历,直到i所指向的元素值大于基准元素x时,停止遍历,将其放到j的位置(因为上面一步j的值已经占用到了i的位置,腾出位置了)
- 依此类推,两边轮流遍历, 直到指针i与指针j相等或者大于(实际肯定是i==j)时,停止外部循环。此时必定左边都是比x小的, 右边是比x大的.
- 最后直接将基准元素x直接放置于指针i所指向的位置即可
- 完成分区操作, 从i的位置一分为二, 左边和右边再递归执行上面的操作. 层层细分
接下来,我们通过示图来展示上述分区算法思路的过程:
public class QuickSort { public static void sort(int[] arr,int begin,int end) { //先定义两个参数接收排序起始值和结束值 int a = begin; int b = end; //先判断a是否大于b if (a >= b) { //没必要排序 return; } //基准数,默认设置为第一个值 int x = arr[a]; //循环 while (a < b) { //从后往前找,找到一个比基准数x小的值,赋给arr[a] //如果a和b的逻辑正确--a<b ,并且最后一个值arr[b]>x,就一直往下找,直到找到后面的值大于x while (a < b && arr[b] >= x) { b--; } //跳出循环,两种情况,一是a和b的逻辑不对了,a>=b,这时候排序结束.二是在后面找到了比x小的值 if (a < b) { //将这时候找到的arr[b]放到最前面arr[a] arr[a] = arr[b]; //排序的起始位置后移一位 a++; } //从前往后找,找到一个比基准数x大的值,放在最后面arr[b] while (a < b && arr[a] <= x) { a++; } if (a < b) { arr[b] = arr[a]; //排序的终止位置前移一位 b--; } } //跳出循环 a < b的逻辑不成立了,a==b重合了,此时将x赋值回去arr[a] arr[a] = x; //调用递归函数,再细分再排序 sort(arr,begin,a-1); sort(arr,a+1,end); } }
3.冒泡排序 low版
每次冒泡过程都是从数列的第一个元素开始,然后依次和剩余的元素进行比较, 跟列队一样, 从左到右两两相邻的元素比大小, 高的就和低的换一下位置. 最后最高(值最大)的肯定就排到后面了.
但是这只是把最高的排到后面了, 还得找出第二高的, 于是又从第一个开始两两比较, 高的往后站, 然后第二高的也到后面了.
然后是第三高的再往后排…
public class MaoPao { public static void sort(int[] arr){ for (int i = 1; i < arr.length; i++) { //第一层for循环,用来控制冒泡的次数 for (int j = 0; j < arr.length-1; j++) { //第二层for循环,用来控制冒泡一层层到最后 //如果前一个数比后一个数大,两者调换 ,意味着泡泡向上走了一层 if (arr[j] > arr[j+1] ){ int temp = arr[j]; arr[j] = arr[j+1]; arr[j+1] = temp; } } } } }
4.冒泡排序 bigger版
补充, 改进后,看下文的测试结果发现提升并不大, 这是正常的, 因为改进后省略的是排序成功后的判断步骤, 而就算没改进, 排序成功后也只不过是对数组进行遍历而已, 没有进行数据更新操作, 而我们知道数组是读取快更新慢的, 所以和上面的版本相比看起来提升不算大
在这个版本中,改动了两点
- 第一点是加入了一个布尔值,判断第二层循环中的调换有没有执行,如果没有进行两两调换,说明后面都已经排好序了,已经不需要再循环了,直接跳出循环,排序结束.
- 第二点是第二层循环不再循环到arr.length - 1,因为外面的i循环递增一次,说明数组最后就多了一个排好序的大泡泡.第二层循环也就不需要到最末尾一位了,可以提前结束循环
/** * 终极版冒泡排序 * 加入一个布尔变量,如果内循环没有交换值,说明已经排序完成,提前终止 * @param arr */ public static void sortPlus(int[] arr){ if(arr != null && arr.length > 1){ for(int i = 0; i < arr.length - 1; i++){ // 初始化一个布尔值 boolean flag = true; for(int j = 0; j < arr.length - i - 1 ; j++){ if(arr[j] > arr[j+1]){ // 调换 int temp; temp = arr[j]; arr[j] = arr[j+1]; arr[j+1] = temp; // 改变flag flag = false; } } if(flag){ break; } } } }
5.选择排序
选择排序也是一种简单直观的排序算法,实现原理比较直观易懂:
首先在未排序数列中找到最小元素,然后将其与数列的首部元素进行交换,然后,在剩余未排序元素中继续找出最小元素,将其与已排序数列的末尾位置元素交换。以此类推,直至所有元素圴排序完毕.
同理,可以类比与打扑克和打麻将, 和上面插入排序不同, 插入排序相当于抽一张牌整理好了再抽一张, 而选择排序相当于一次性给你一副乱牌, 然后慢慢整理的感觉.
这也容易理解为什么选择排序为啥比插入排序慢了. 插入排序是摸一张牌, 然后直接插入到手中已经排好序的牌,再摸下一张牌.
选择排序相当于在一堆牌中, 不断的找到最小的牌往前面放.
public static void sort(int[] arr){ for(int i = 0; i < arr.length - 1 ; i++){ int min = i; // 遍历的区间最小的值 for (int j = i + 1; j < arr.length ;j++){ if(arr[j] < arr[min]){ // 找到当前遍历区间最小的值的索引 min = j; } } if(min != i){ // 发生了调换 int temp = arr[min]; arr[min] = arr[i]; arr[i] = temp; } } }
6. 归并排序
归并排序,简单的说把一串数
从中平等分为两份,再把两份再细分,直到不能细分为止. 这就是分而治之的分的步骤.
再从最小的单元,两两合并,合并的规则是将其按从小到大的顺序放到一个临时数组中,再把这个临时数组替换原数组相应位置,这就是治. 图解如下:
代码:
public static void mergeSort(int[] a,int s,int e){ int m = (s + e) / 2; if (s < e){ mergeSort(a,s,m); mergeSort(a,m+1,e); //归并 merge(a,s,m,e); } } private static void merge(int[] a, int s, int m, int e) { //初始化一个从起始s到终止e的一个数组 int[] temp = new int[(e - s) + 1]; //左起始指针 int l = s; //右起始指针 int r = m+1; int i = 0; //将s-e这段数据在逻辑上一分为二,l-m为一个左边的数组,r-e为一个右边的数组,两边都是有序的 //从两边的第一个指针开始遍历,将其中小的那个值放在temp数组中 while (l <= m && r <= e){ if (a[l] < a[r]){ temp[i++] = a[l++]; }else{ temp[i++] = a[r++]; } } //将两个数组剩余的数放到temp中 while (l <= m){ temp[i++] = a[l++]; } while (r <= e){ temp[i++] = a[r++]; } //将temp数组覆盖原数组 for (int n = 0; n < temp.length; n++) { a[s+n] = temp[n]; } }
8. 堆排序
堆排序, 顾名思义, 就是将数据以堆的结构, 或者说类似于二叉树的结构, 每次都整理二叉树将最大值找到, 然后放到数组末尾. 个人感觉有点像选择排序
.都是每次遍历选择一个最大值或最小值
从下往上调整堆, 将最大值放到顶部
- 首先我们可以把一个数组, 从上往下, 从左到右依次放置成为二叉树
- 接着我们创建最大顶堆, 就是将最大的值调整到顶部.
- 然后我们开始遍历, 把这个[0]的最大值放到最末尾, 然后再次整理二叉树, 当然将最后一位排除在外.然后我们将截至末尾的下标往前移一位.
- 一直遍历, 把最大值放到顶部, 再调换到末尾, 到只剩最后一个元素,
找到最大值后, 放到数组后面, 并设置一个标记, 表示截止后面的都是已排序的元素, 相当于堆删除一个元素
因为是树结构, 所以整理一次树的时间复杂度是O(logn), 但是又因为它需要遍历一次挨个整理找到剩下数据中的最大值, 所以它的最坏,最好,平均时间复杂度均为O(nlogn)
踩坑
大家可以直奔v3.0版本
v1.0 巨慢不能用
这里说下踩坑, 下面是我写的堆排序v1.0版本, 写了个简单的数组测试了下发现也没有问题, ok. 然后我写一个10w的数组来和冒泡排序, 选择排序等比较, 结果发现程序像是卡死了直接花了几分钟还没出结果. 这已经远远大于冒泡排序的时间了.
/** * 最大顶堆排序 * @param a */ public static void topMaxHeapSort(int[] a){ //先创建最大顶堆 createTopMaxHeap(a); int end = a.length - 1 ; while(end > 0 ){ //把0位的最大值放到最后 swaparr(a, 0, end); //将计算的长度减一.不考虑最后的那个值 end--; //重新调整堆结构 handleMaxHeapFromIndex(a, end); } //打印下看看 // System.out.println(Arrays.toString(a)); } /** [3,7,1,4,9,5,6,7,2,6,8,3] * `````````3 * ``````/ \ * `````7 1 * ````/ \ / \ * ``4 9 5 6 * `/ \ / \ / * `7 2 6 8 3 * 变成 [9, 7, 6, 7, 6, 5, 1, 4, 2, 3, 8, 3] * `````````9 * ```````/ \ * `````7 6 * ````/ \ / \ * ``7 6 5 1 * `/ \ / \ / * `4 2 3 8 3 * 构建最大顶堆, 变成父节点都比子节点大的树 * @param a */ public static void createTopMaxHeap(int[] a){ //从倒数第二排最后一个开始, 从下往上, 层层处理把最大的换上去构建最大顶堆 //如上面的注释, 就是从5开始. 再往后就没意义了 handleMaxHeapFromIndex(a,a.length-1); //打印下看看 // System.out.println(Arrays.toString(a)); } private static void handleMaxHeapFromIndex(int[] a,int end){ for (int i = end / 2; i>=0; i--) { //从i开始往后面调整它的堆 //左子节点, 右子节点 // 设置一个用于玩下遍历和判断的子节点, 默认就是左边的儿子 int child = 2 * i + 1; while (child <= end){ //如果右子节点比左边大 int leftson = child; int rightson = child + 1; if(rightson <= end && a[rightson] > a[leftson]){ //就设置为右边的儿子 child++; } //再比较父子,如果儿子比父亲大,就互换 if(a[i] < a[child]){ swaparr(a,i,child); } //继续循环 i = child; //继续选择它的左儿子 child = 2 * i + 1; } } } private static void swaparr(int[] arr,int a,int b){ int temp = arr[a]; arr[a] = arr[b]; arr[b] = temp; }
v2.0 太慢不能用
考虑肯定调整堆的代码有问题
- 在初始构建了最大顶堆时, 父亲都比儿子大
- 后面每次都只移除顶部元素.即变化了第一层
- 那我在调整的时候, 如果这个节点比儿子节点都大, 那应该下面的都是调整好的不用管.
我选择在handleMaxHeapFromIndex
方法中, 加入了break来提前跳出循环, 如下:
while (child <= end) { // 如果右子节点比左边大 int leftson = child; int rightson = child + 1; if (rightson <= end && a[rightson] > a[leftson]) { // 就设置为右边的儿子 child++; } // 再比较父子,如果儿子比父亲大,就互换 if (a[i] < a[child]) { swaparr(a, i, child); } else { // 否则直接跳出循环, 只要父节点比子节点大, 不用管下面的调整了 break; } // 继续循环 i = child; // 继续选择它的左儿子 child = 2 * i + 1; }
再跑一次, 发现还是很慢, 但是比之前好多了, 但是还是耗时很久, 这也还是有问题啊…
v3.0
代码如下:
/** * 最大顶堆排序 * * @param a */ public static void topMaxHeapSort(int[] a) { // 先创建最大顶堆 createTopMaxHeap(a); System.out.println("创建完毕"); int end = a.length - 1; while (end > 0) { // 把0位的最大值放到最后 swaparr(a, 0, end); // 将计算的长度减一.不考虑最后的那个值 end--; handleMaxHeapFromIndex(a, 0, end); } // 打印下看看 // System.out.println(Arrays.toString(a)); } /** [3,7,1,4,9,5,6,7,2,6,8,3] * `````````3 * ``````/ \ * `````7 1 * ````/ \ / \ * ``4 9 5 6 * `/ \ / \ / * `7 2 6 8 3 * 变成 [9, 7, 6, 7, 6, 5, 1, 4, 2, 3, 8, 3] * `````````9 * ```````/ \ * `````7 6 * ````/ \ / \ * ``7 6 5 1 * `/ \ / \ / * `4 2 3 8 3 * 构建最大顶堆, 变成父节点都比子节点大的树 * @param a */ public static void createTopMaxHeap(int[] a) { // 从倒数第二排最后一个开始, 从下往上, 层层处理把最大的换上去构建最大顶堆 // 如上面的注释, 就是从5开始. 再往后就没意义了 for (int i = (a.length - 1) / 2; i >= 0; i--) { handleMaxHeapFromIndex(a, i, a.length - 1); } // 打印下看看 // System.out.println(Arrays.toString(a)); } private static void handleMaxHeapFromIndex(int[] a, int i, int end) { // 从i开始往后面调整它的堆 // 左子节点, 右子节点 // 设置一个用于玩下遍历和判断的子节点, 默认就是左边的儿子 int child = 2 * i + 1; while (child <= end) { // 如果右子节点比左边大 int leftson = child; int rightson = child + 1; if (rightson <= end && a[rightson] > a[leftson]) { // 就设置为右边的儿子 child++; } // 再比较父子,如果儿子比父亲大,就互换 if (a[i] < a[child]) { swaparr(a, i, child); } else { // 否则直接跳出循环, 只要父节点比子节点大, 不用管下面的调整了 break; } // 继续循环 i = child; // 继续选择它的左儿子 child = 2 * i + 1; } } private static void swaparr(int[] arr, int a, int b) { int temp = arr[a]; arr[a] = arr[b]; arr[b] = temp; }
无奈之下参考了别人的博客(也有一些写的是我1.0版本和2.0版本的), 最后发现问题
首先再分析为什么要分成两步, 1. 创建大顶堆. 2. 遍历调整 ?
在创建大顶堆的时候, 是从(a.length-1)/2
处从下往上整理, 才能确保最大值能像冒泡一样跑到顶部
那在构建完了大顶堆后, 我们还需不需要重新从这个位置倒排往上整理呢? 其实是不需要的. 因为变化的是第一个元素, 除了这个元素以外, 其他的元素经过大顶堆的整理肯定父亲比儿子大.
所以后面遍历调整的时候, 只需要从0下标开始找最大值就可以了. 这样就可以去掉handleMaxHeapFromIndex
外层的那个循环:
private static void handleMaxHeapFromIndex(int[] a,int end){ for (int i = end / 2; i>=0; i--) { //这个循环只在创建大顶堆的时候需要, 这个就可以去掉了 .... while (child <= end){ ... } }
另外一个坑, child<=end这里要用大于等于号, 以及后面的rightson <= end .因为我就写着写着忘记了end是最后处理的下标, 而不是数组长度, 习惯性用的<号, 导致最后2个无法排序
9. 其他排序
比如Arrays工具类提供的排序方法。它内部实现也是快速排序
private static void arraysSort(int[] a){ Arrays.sort(a); }
还有就是将数组转为list,使用集合的排序方法,但是这无异于兜圈子,因为集合底层也是数组
private static void listSort(int[] a){ List<Integer> integers = Ints.asList(a); Collections.sort(integers); integers.toArray(new Integer[a.length]); }
10. 比较
试了一下几个排序的速度,代码如下:
public static void main(String[] args) { int[] arr = new int[200000]; int[] a =getRandomArr(arr); int[] b = a.clone(); int[] c = b.clone(); int[] d = b.clone(); int[] e = b.clone(); int[] f = b.clone(); int[] g = b.clone(); int[] h = b.clone(); long s = Clock.systemDefaultZone().millis(); quickSort(a, 0, a.length - 1); System.out.println("quickSort耗时: " + (Clock.systemDefaultZone().millis() - s) + " ms"); s = Clock.systemDefaultZone().millis(); mergeSort(b,0,b.length-1); System.out.println("mergeSort: " + (Clock.systemDefaultZone().millis() - s) + " ms"); s = Clock.systemDefaultZone().millis(); listSort(c); System.out.println("listSort耗时: " + (Clock.systemDefaultZone().millis() - s) + " ms"); s = Clock.systemDefaultZone().millis(); arraysSort(d); System.out.println("arraysSort耗时: " + (Clock.systemDefaultZone().millis() - s) + " ms"); s = Clock.systemDefaultZone().millis(); maoPaoSort(e); System.out.println("maoPaoSort耗时: " + (Clock.systemDefaultZone().millis() - s) + " ms"); s = Clock.systemDefaultZone().millis(); maoPaoSortPlus(f); System.out.println("maoPaoSortPlus耗时: " + (Clock.systemDefaultZone().millis() - s) + " ms"); s = Clock.systemDefaultZone().millis(); insertSort(g); System.out.println("insertSort耗时: " + (Clock.systemDefaultZone().millis() - s) + " ms"); s = Clock.systemDefaultZone().millis(); selectSort(h); System.out.println("selectSort耗时: " + (Clock.systemDefaultZone().millis() - s) + " ms"); } /** * 获取一个打乱的数组 * @param arr */ private static int[] getRandomArr(int[] arr) { for (int i = 0; i < arr.length; i++) { arr[i] = new Random().nextInt(arr.length); } return arr; }
分别对1k,1w,10w,20w大小的随机数组排序,结果如下:
得到综合结果是:
速度: 快速排序>>归并排序>>>>>插入排序>>选择排序>>冒泡排序
并且可以看到,选择排序,冒泡排序在数据量越来越大的情况下,耗时已经呈指数型上涨,而不是倍数上涨,在50w的时候已经需要足足5分钟以上
//---1k---
quickSort耗时: 0 ms
mergeSort: 1 ms
listSort耗时: 7 ms
arraysSort耗时: 1 ms
maoPaoSort耗时: 3 ms
maoPaoSortPlus耗时: 4 ms
insertSort耗时: 2 ms
selectSort耗时: 3 ms
//---1w---
quickSort耗时: 2 ms
mergeSort: 3 ms
listSort耗时: 19 ms
arraysSort耗时: 4 ms
maoPaoSort耗时: 166 ms
maoPaoSortPlus耗时: 122 ms
insertSort耗时: 12 ms
selectSort耗时: 52 ms
//---10w---
quickSort耗时: 14 ms
mergeSort: 19 ms
listSort耗时: 65 ms
arraysSort耗时: 12 ms
maoPaoSort耗时: 15242 ms
maoPaoSortPlus耗时: 15044 ms
insertSort耗时: 797 ms
selectSort耗时: 4073 ms
//---20w---
quickSort耗时: 26 ms
mergeSort: 34 ms
listSort耗时: 102 ms
arraysSort耗时: 60 ms
maoPaoSort耗时: 60811 ms
maoPaoSortPlus耗时: 60378 ms
insertSort耗时: 3279 ms
selectSort耗时: 15762 ms
2021年11月25日 更新. 增加了堆排序
// 20w数据
quickSort耗时: 39 ms
mergeSort: 32 ms
创建完毕
heapSort耗时: 21 ms
listSort耗时: 111 ms
arraysSort耗时: 20 ms
maoPaoSort耗时: 50410 ms
maoPaoSortPlus耗时: 55862 ms
insertSort耗时: 10127 ms
selectSort耗时: 8619 ms
总结
加载全部内容