
大家好,我是翟路佳。全栈工程师,编程爱好者,喜欢分享。
我今年的首要目标是成为一名合格的讲师,帮助尽可能多的同学获得进步。
经常出没于:
冒泡排序是一种简单的排序算法。它重复地走访要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。
arr,需要降序排列arr[0] 与 arr[1],如果 arr[0] < arr[1] 就交换它们的位置arr[1] 与 arr[2],如果 arr[1] < arr[2] 就交换它们的位置arr[N-M] 即可完成后的代码如下:
let arr = ['待', '排', '序', '数', '组', ...];
for (let i = 0, len = arr.length - 1; i < len; i++) {
for (let j = 0, jlen = len - i; j < jlen; j++) {
if (arr[j] < arr[j + 1]) {
let tmp = arr[j];
arr[j] = arr[j + 1];
arr[j + 1] = tmp;
}
}
}
跑几个例子试一下:
./sample/bubble.js
从代码中我们可以知道,冒泡排序第1次对比了 N-1 次,第2次对比 N - 2 次....
所以是一个等差数列相加:
(N - 1) + (N -2) + .... + 2 + 1
= (N - 1) / 2 * N
= (N^2 - N) / 2
于是,冒泡排序的时间复杂度记为:O(n2)。
同时,它的空间复杂度为:S(1)。
时间复杂度 与 空间复杂度 是我们评价一个算法的主要指标,大部分的优化都试图降低这两个复杂度。
通常来说,很少有同时降低时间复杂度与空间复杂度的算法。
大部分优化都是时间换空间或者空间换时间。
假设数组是有序的,那么只需要扫描数组,找到比要插入的数大/小的位置,插入新值,即可。
没有有序数组,那就构建有序数组,即可。
arr[1] 与之比较,如果 arr[0] > arr[1],就把 arr[1] 插入 arr[0] 的前面arr[2] 与它们比较,如果有比 arr[2] 大的,就把 arr[2] 插到它前面JavaScript 表示如下:
for (let i = 1, len = arr.length; i < len; i++) {
for (let j = 0, jlen = i; j < jlen; j++) {
if (arr[i] < arr[j]) {
arr.splice(i, 0);
arr.splice(j, 0, arr[i]);
break;
}
}
}
从 break 可以看出,插入排序的时间复杂度并不稳定。
不过,因为一直在原有数组上操作,所以其空间复杂度是 S(1)。
很多排序算法都有 最好情况 和 最差情况,这也是我们挑选算法和做优化时必须注意的。
既然数组部分有序,对于有序的部分,其实不用全扫描这么麻烦。
我们可以用“二分查找法”来找到合适插入的位置。
对于一段长度为 N 的有序数组 arr,要查找最合适插入 M 的位置
arr[N / 2]M < arr[N / 2] 则继续对比 arr[N / 4];否则,对比 arr[N * 3 / 4]二分查找法是最简单的检索方法。它的算法复杂度是 O(logN)。
它的 JavaScript 实现如下:
function find(num, arr) {
function binarySearch(left, right) {
if (left > right) {
return -1;
}
if (right - left <= 1) {
return num > left ? right : left;
}
let mid = right + left >> 1;
if (num <= arr[mid]) {
return binarySearch(left, mid);
} else {
return binarySearch(mid + 1, right);
}
}
return binarySearch(0, arr.length - 1);
}
用 Debug 看一下效果:
./sample/insert.js
使用二分查找法改造插入排序之后,变为:
for (let i = 1, len = arr.length; i < len; i++) {
let index = find(arr[i], arr.slice(0, i));
arr.splice(i, 1);
arr.splice(index, 0, arr[i]);
}
改造之后的“二分查找插入排序”的时间复杂度就变成:
log1 + log2 + log3 + .... + logN ≈ O(NlogN)
它不再有最好情况和最坏情况。
其空间复杂度不变。
注意:我们所有的复杂度,都仅仅建立在排序算法之上,没有包含数组本身的操作!所以,今天我们说的复杂度和实际复杂度会有出入。
具体的出入大小,需要看运行环境的实现。
仅就“二分查找插入排序”而言,移动数组元素的成本很高,所以它的时间复杂度并不低。
堆排序是利用“堆”这种数据结构的特性进行排序的算法。
堆可以视作一棵完全二叉树,它满足:

如果有了堆,那么对其排序是很简单的:

图片来自 精通八大排序算法系列:二、堆排序算法
构造堆
function maxHeapify(arr, index, heapSize) {
let max = index;
let left = index * 2 + 1;
let right = index * 2 + 2;
let big = right < heapSize && arr[right] > arr[left] ?
right : left;
if (big < heapSize && arr[index] < arr[big]) {
max = big;
}
if (max !== index) {
swap(arr, max, index);
maxHeapify(arr, index, heapSize);
}
}
// 从最后一个父节点开始遍历,将其转化为“最大堆”
for (let i = arr.length >> 1; i >= 0; i--) {
maxHeapify(arr, i, arr.length);
}
排序
for (let i = arr.length - 1; i > 0; i--) {
swap(0, i);
maxHeapify(arr, 0, i - 1);
}
因为构建堆和排序是分开的,所以可以分开计算,然后相加。
总复杂度 = 构建堆 + 排序
构建堆:
排序:
合并:
(N - 1)logN + N ≈ NlogN
很明显,堆排序的空间复杂度是 S(1)。
归并排序是分治法的一种体现。分治法的思路是:把一个大问题分解成若干小问题,分别解决之后再合并回大问题。
这种思路一方面可能降低算法的复杂度;另一方面,把问题分解,可以用有限的资源解决较小的问题,变不可能为可能。
分治法的核心在于分解和合并。
合并过程:
function mergeSort(arr) {
function merge(left, right) {
let final = [];
while (left.length && right.length) {
final.push(left[0] < right[0] ?
left.shift() : right.shift());
}
return final.concat(left, right);
}
let len = arr.length;
if (len < 2) return this;
let mid = len >> 1;
return merge(mergeSort(arr.slice(0, mid)),
mergeSort(arr.slice(mid)));
}
很明显,快速排序的时间复杂度是 O(NlogN):
快速排序是分治法的另一种体现。
我们通常使用“原地排序”(in-place)版本,即选定一个元素,把它移到最左边或最右边,然后遍历数组。或者干脆拿最左边或者最右边的元素作为基准元素。
function quickSort(arr, left, right) {
let pivot = arr[left];
let current = left + 1;
for (let i = current; i <= right; i++) {
if (arr[i] <= pivot) {
swap(arr, i, current);
current++;
}
}
swap(arr, left, current);
quickSort(arr, left, current - 1);
quickSort(arr, current + 1, right);
}
最理想的情况下,快速排序的时间复杂度为 O(NlogN):
最坏的情况下,每次都选到一个边界值,时间复杂度就是 O(N2)(=冒泡)。
那么问题就是如何让数组均分。
一般来说,面对一个很随机的数组,可以取随机数。
生产实践中,数组可能不那么随机,可以考虑“三数取中”。
如果数组很长,可以隔一段取一个,然后对所有取出的值取中。
考虑一种极端情况:一个全部元素都相同的数组。
沿用前面的“单向扫描法”,复杂度会衰弱到 O(N2)。
此时最好用“双向扫描法”,可以恢复到 O(NlogN):
>= pivot,停下<= pivot,停下function quickSort(arr, left, right) {
let pivot = arr[left];
let i = current = left + 1;
let j = right;
while (i <= j) {
while(i <= right && arr[i] < pivot) {
i++;
}
while(x[j] > pivot) {
j--;
}
if (i <= j) {
swap(arr, i, j);
}
}
swap(arr, left, j);
quickSort(arr, left, j - 1);
quickSort(arr, j + 1, right);
}
小知识:
排序的时间复杂度最低为 O(NlogN)
> < 会调用对象的 .valueOf() 方法取值后比较Array.prototype.sort()用法:
arr.sort([compareFunction]);
其中:
compareFunction 可为空,此时,按照“字符比较”排序compareFunction 的结果排序arr.sort( (a, b) => {
return a - b;
});
比较函数(compareFunction)的返回值
快速排序的效率很高,所以大部分排序算法都在想办法优化它。
内省排序的优化点:
for (let i = 0; i < 100000000; i++) {
if (i % 2 === 0) {
// do something
}
}
答:
for (let i = 0; i < 100000000; i += 2) {
// do something
}
答案:
最直接的做法是3次遍历,复杂度 O(n) + O(n - 1) + O(n - 2) = O(3n-3)。
最快的应该是堆排序,复杂度 O(n) + 3 O(logN) = O(n + 3 logN)
(比如 deposit 和 topside)
答案:
假定这本字典里有 N 个单词,我们需要遍历它,并且给予每个单词一个指纹。
比如 meathill = m1e1a1t1h1i1l2 = a1e1h1i1l2m1t1
然后把所有单词按照指纹归档。即可。
我认为排序算法不用背,尤其作为前端,但是理解这些概念、记住实现思路非常重要。时不时的写一写,锻炼一下动手能力也是很重要的。
Q&A
实体书:
参考阅读: