排序算法

在计算机科学与数学中，一个排序算法（英语：Sorting algorithm）是一种能将一串资料依照特定排序方式排列的算法。最常用到的排序方式是数值顺序以及字典顺序。有效的排序算法在一些算法（例如搜索算法与合并算法（英语：Merge algorithm））中是重要的，如此这些算法才能得到正确解答。排序算法也用在处理文字资料以及产生人类可读的输出结果。基本上，排序算法的输出必须遵守下列两个原则：

输出结果为递增序列（递增是针对所需的排序顺序而言）
输出结果是原输入的一种排列、或是重组

虽然排序算法是一个简单的问题，但是从计算机科学发展以来，在此问题上已经有大量的研究。举例而言，冒泡排序在1956年就已经被研究。虽然大部分人认为这是一个已经被解决的问题，有用的新算法仍在不断的被发明。（例子：图书馆排序在2004年被发表）

分类[编辑]

在计算机科学所使用的排序算法通常依以下标准分类：

计算的时间复杂度（最差、平均、和最好性能），依据列表（list）的大小( $n$ )。一般而言，好的性能是 $O(n\log n)$ （大O符号），坏的性能是 $O(n^{2})$ 。对于一个排序理想的性能是 $O(n)$ ，但平均而言不可能达到。基于比较的排序算法对大多数输入而言至少需要 $O(n\log n)$ 。
内存使用量（以及其他电脑资源的使用）
稳定性：稳定排序算法会让原本有相等键值的纪录维持相对次序。也就是如果一个排序算法是稳定的，当有两个相等键值的纪录 $R$ 和 $S$ ，且在原本的列表中 $R$ 出现在 $S$ 之前，在排序过的列表中 $R$ 也将会是在 $S$ 之前。
排序的方法：插入、交换、选择、合并等等。

稳定性[编辑]

当相等的元素是无法分辨的，比如像是整数，稳定性并不是一个问题。然而，假设以下的数对将要以他们的第一个数字来排序。

 $(4,1)(3,1)(3,7)(5,6)$

在这个状况下，有可能产生两种不同的结果，一个是让相等键值的纪录维持相对的次序，而另外一个则没有：

 $(3,1)(3,7)(4,1)(5,6)$  （維持次序）
 $(3,7)(3,1)(4,1)(5,6)$  （次序被改變）

不稳定排序算法可能会在相等的键值中改变纪录的相对次序，但是稳定排序算法从来不会如此。不稳定排序算法可以被特别地实现为稳定。作这件事情的一个方式是人工扩展键值的比较，如此在其他方面相同键值的两个对象间之比较，（比如上面的比较中加入第二个标准：第二个键值的大小）就会被决定使用在原先资料次序中的条目，当作一个同分决赛。然而，要记住这种次序通常牵涉到额外的空间负担。

排序算法列表[编辑]

在这个表格中， $n$ 是要被排序的纪录数量以及 $k$ 是不同键值的数量。

稳定的排序[编辑]

冒泡排序（bubble sort）— $O(n^{2})$
插入排序（insertion sort）— $O(n^{2})$
鸡尾酒排序（cocktail sort）— $O(n^{2})$
桶排序（bucket sort）— $O(n)$ ；需要 $O(k)$ 额外空间
计数排序（counting sort）— $O(n+k)$ ；需要 $O(n+k)$ 额外空间
归并排序（merge sort）— $O(n\log n)$ ；需要 $O(n)$ 额外空间
原地归并排序— $O(n\log ^{2}n)$ 如果使用最佳的现在版本
二叉排序树排序（binary tree sort）— $O(n\log n)$ 期望时间； $O(n^{2})$ 最坏时间；需要 $O(n)$ 额外空间
鸽巢排序（pigeonhole sort）— $O(n+k)$ ；需要 $O(k)$ 额外空间
基数排序（radix sort）— $O(nk)$ ；需要 $O(n)$ 额外空间
侏儒排序（gnome sort）— $O(n^{2})$
图书馆排序（library sort）— $O(n\log n)$ 期望时间； $O(n^{2})$ 最坏时间；需要 $(1+\varepsilon )n$ 额外空间
块排序（英语：Block sort）（block sort）— $O(n\log n)$
Tim排序（Timsort）— $O(n\log n)$ 平均、最坏时间； $O(n)$ 最优时间；需要 $O(n)$ 额外空间；是目前已知最快的排序算法，在Python、Swift、Rust等语言的内置排序功能中被用作默认算法

不稳定的排序[编辑]

选择排序（selection sort）— $O(n^{2})$
希尔排序（shell sort）— $O(n\log ^{2}n)$ 如果使用最佳的现在版本
克洛弗排序（Clover sort）— $O(n)$ 期望时间， $O(n^{2})$ 最坏情况^{[来源请求]}
梳排序— $O(n\log n)$
堆排序（heap sort）— $O(n\log n)$
平滑排序（英语：Smoothsort）（smooth sort）— $O(n\log n)$
快速排序（quick sort）— $O(n\log n)$ 期望时间， $O(n^{2})$ 最坏情况
内省排序（introsort）— $O(n\log n)$
耐心排序（patience sort）— $O(n\log n+k)$ 最坏情况时间，需要额外的 $O(n+k)$ 空间，也需要找到最长的递增子序列（longest increasing subsequence）

不实用的排序[编辑]

Bogo排序— $O(n\times n!)$ ，最坏的情况下期望时间为无穷。
Stupid排序— $O(n^{3})$ ;递归版本需要 $O(n^{2})$ 额外存储器
珠排序（bead sort）— $O(n)$ 或 $O({\sqrt {n}})$ ,但需要特别的硬件
煎饼排序— $O(n)$ ,但需要特别的硬件
臭皮匠排序（stooge sort）算法简单，但需要约 $n^{2.7}$ 的时间

简要比较[编辑]

名称	数据对象	稳定性	时间复杂度		额外空间复杂度	描述
名称	数据对象	稳定性	平均	最坏	额外空间复杂度	描述
冒泡排序	数组		$O(n^{2})$		$O(1)$	（无序区，有序区）。从无序区透过交换找出最大元素放到有序区前端。
选择排序	数组		$O(n^{2})$		$O(1)$	（有序区，无序区）。在无序区里找一个最小的元素跟在有序区的后面。对数组：比较得多，换得少。
选择排序	链表		$O(n^{2})$		$O(1)$	（有序区，无序区）。在无序区里找一个最小的元素跟在有序区的后面。对数组：比较得多，换得少。
插入排序	数组、链表		$O(n^{2})$		$O(1)$	（有序区，无序区）。把无序区的第一个元素插入到有序区的合适的位置。对数组：比较得少，换得多。
堆排序	数组		$O(n\log n)$		$O(1)$	（最大堆，有序区）。从堆顶把根卸出来放在有序区之前，再恢复堆。
归并排序	数组		$O(n\log ^{2}n)$		$O(1)$	把数据分为两段，从两段中逐个选最小的元素移入新数据段的末尾。可从上到下或从下到上进行。
	数组		$O(n\log n)$		$O(n)+O(\log n)$ 如果不是从下到上
	链表		$O(n\log n)$		$O(1)$
快速排序	数组		$O(n\log n)$	$O(n^{2})$	$O(\log n)$	（小数，基准元素，大数）。在区间中随机挑选一个元素作基准，将小于基准的元素放在基准之前，大于基准的元素放在基准之后，再分别对小数区与大数区进行排序。
快速排序	链表		$O(n\log n)$	$O(n^{2})$	$O(\log n)$
希尔排序	数组		$O(n\log ^{2}n)$	$O(n^{2})$	$O(1)$	每一轮按照事先决定的间隔进行插入排序，间隔会依次缩小，最后一次一定要是1。

计数排序	数组、链表		$O(n+m)$		$O(n+m)$	统计小于等于该元素值的元素的个数i，于是该元素就放在目标数组的索引i位（i≥0）。
桶排序	数组、链表		$O(n)$	$O(n^{2})$	$O(m)$	将值为i的元素放入i号桶，最后依次把桶里的元素倒出来。
基数排序	数组、链表		$O(k\times n)$	$O(n^{2})$		一种多关键字的排序算法，可用桶排序实现。

均按从小到大排列
k代表数值中的"数位"个数
n代表数据规模
m代表数据的最大值减最小值

参考文献[编辑]

外部链接[编辑]