数据结构——快速排序

张玉茹
张玉茹   发布于 2018-09-27 16:57
阅读量: 112

       快速排序是C.R.A.Hoare于1962年提出的一种划分交换排序。它采用了一种分治的策略,通常称其为分治法(Divide-and-ConquerMethod)。
       分治法的基本思想是:将原问题分解为若干个规模更小但结构与原问题相似的子问题。递归地解这些子问题,然后将这些子问题的解组合为原问题的解。下面这张图会说明分治算法是如何进行的:将cn分成了两个cn/2,转而分成了cn/4,cn/8......通过这样一层一层的求解规模小的子问题,最终将其合并之后就能求出原问题的解。

                            

                                                                 图 1分治法示意图

一、快速排序的基本思想
      设当前待排序的无序区为L[low..high],利用分治法可将快速排序的基本思想描述为:
      ①分解: 
       在L[low..high]中任选一个记录作为基准(Pivot),以此基准将当前无序区划分为左、右两个较小的子区间L[low..pivotpos-1]和L[pivotpos+1..high],并使左边子区间中所有记录的关键字均小于等于基准记录(不妨记为pivot)的关键字pivot.key,右边的子区间中所有记录的关键字均大于等于pivot.key,而基准记录pivot则位于正确的位置(pivotpos)上,它无须参加后续的排序。
       注意:划分的关键是要求出基准记录所在的位置pivotpos。划分的结果可以简单地表示为(注意pivot=L[pivotpos]):
  L[low..pivotpos-1].keys≤L[pivotpos].key≤L[pivotpos+1..high].keys
       其中low≤pivotpos≤high。
       ②求解: 
       通过递归调用快速排序对左、右子区间L[low..pivotpos-1]和L[pivotpos+1..high]快速排序。

       ③组合: 
       因为当"求解"步骤中的两个递归调用结束时,其左、右两个子区间已有序。对快速排序而言,"组合"步骤无须做什么,可看作是空操作。

二、快速排序的单趟算法:

       快速排序分解后的过程可看为一趟快速排序。

       一趟快速排序的具体做法是:附设两个指针low 和 high,设枢轴记录的关键字为pivotkey,将枢轴记录暂存在r[0]的位置上,则首先从high所指位置起向前搜索找到第一个关键字小于pivotkey的记录并将high位置所存放的记录值移动到low位置保存,然后从low位置所指位置起向后搜索,找到第一个大于pivotkey的记录并将low位置所存放的记录值移动到high位置保存,重复这两步,直到low=high为止,再将枢轴记录移至正确位置上。

       一趟快速排序的的过程如图所示:

                                                                    图 2 快速排序实例

       一趟快速排序算法如下:

int Partition(SqList &L,int low,int high)
{
    L.r[0]=L.r[low];  //用子表的的第一个记录作为枢轴记录
    pivotkey=L.r[low].key;//枢轴记录关键字
    while(low<high)
    {
	while(low<high && L.r[high].key>=pivotkey)  --high;
	L.r[low]=L.r[high];  //将比枢轴小的元素移动到低端
        while(low<high && L.r[low].key<=pivotkey)   ++low;
	L.r[high]=L.r[low];  //将比枢轴大的元素移动到高端
    }
    L.r[low]=L.r[0]; //枢轴记录到位
    return low; 
}

 

三、快速排序算法:

void quickSort(SqList &L,int low,int high)
{
    if(low<high)  
    {
        pivotloc=Partition(L,low,high);  //将L.r[low..high]一分为二
       quickSort(L,low,pivotloc-1);//递归低端子表,pivotloc为枢轴位置
       quickSort(L,pivotloc+1,high);/*递归高端子表*/
    } 
}

 

        为排序整个文件,只须调用quickSort(L,1,n)即可完成对L[l..n]的排序。

void QSort(SqList &L)
{
    quickSort(L,1,L.length);//递归低子表,pivotloc为枢轴位置
}

 

四、快速排序稳定性:

       稳定算法的定义:如果在待排序表中有两个元素\(R_i\)\(R_j\),其对应的关键字\(key_i\)=\(key_j\),且在排序前\(R_i\)\(R_j\)前,如果使用排序算法后,\(R_i\)仍在\(R_j\)的前边,则称这个排序算法是稳定的。

       在划分算法中,若在右侧(左侧)区间存在两个关键字相同,且均小于(大于)基准值的记录,则在交换到左侧(右侧)区间后,他们的相对位置会发生变化,即快速排序是一个不稳定的排序方法。

五、快速排序时间复杂度

       快速排序的时间复杂度在最坏情况下是\(O(n^{2})\),平均的时间复杂度是\(O(n log_2n)\)

       这句话很好理解:假设被排序的数列中有n个数。遍历一次的时间复杂度是O(n),需要遍历多少次呢?至少\(log_2(n+1)\)次,最多n次。

       (01) 为什么最少是\(log_2(n+1)\)次?快速排序是采用的分治法进行遍历的,我们将它看作一棵二叉树,图如下所示,它需要遍历的次数就是二叉树的深度,我们可以看到如果选的key值(前文所讲的枢轴元素pivotkey)的正确位置刚好在这个序列的中间时,我们可以根据完全二叉树的定义计算得到它的深度是\(log_2(n+1)\)。因此,快速排序的遍历次数最少是\(log_2(n+1)\)次。

                                                          图 3 快速排序二叉树示意图      

(02) 为什么最多是n次?这个应该非常简单,还是将快速排序看作一棵二叉树,但是,如果这个key值得正确位置是在这个区间的最边上,就是说我们选择的这个key是最大值或者最小值,那么就会产生的一个子区间就是空的。那么它的深度就是n。因此,快速排序的遍历次数最多是n次。

六、快速排序的空间复杂度

       由于快速排序是递归的,需要借助一个递归工作栈来保存每一层递归调用的必要信息,其容量应与递归调用的最大深度一致。最好情况下为\(log_2(n+1)\);最坏情况下,因为要进行n-1次递归调用,所以栈的深度为O(n),平均情况下,栈的深度为\(O(log_2n)\),因而空间复杂度在最坏情况下为O(n),平均情况下为\(log_2(n+1)\)

       注意:在快速排序算法中,并不产生有序子序列,但每一趟排序后将一个元素(枢轴元素)放到其最终位置上。

 

 

 

 

 

收藏 转发 评论