我知道这个问题不太具体。
我想要的是有人告诉我如何将普通合并排序转换为就地合并排序(或具有恒定额外空间开销的合并排序)。
我只能在网上找到说“它太复杂”或“超出本文范围”的页面。
唯一已知的就地合并(没有任何额外空间)的方法太复杂,无法简化为实际程序。(从这里拍摄)
即使太复杂,如何进行合并排序的基本概念是什么?
我知道这个问题不太具体。
我想要的是有人告诉我如何将普通合并排序转换为就地合并排序(或具有恒定额外空间开销的合并排序)。
我只能在网上找到说“它太复杂”或“超出本文范围”的页面。
唯一已知的就地合并(没有任何额外空间)的方法太复杂,无法简化为实际程序。(从这里拍摄)
即使太复杂,如何进行合并排序的基本概念是什么?
Answers:
克努斯(Knuth)将此作为练习(第3卷,第5.2.5节)。确实存在就地合并排序。必须认真执行它们。
首先,如描述幼稚就地合并在这里是不是正确的解决方案。它将性能降级为O(N 2)。
想法是对数组的一部分进行排序,同时将其余部分用作合并的工作区域。
例如下面的合并功能。
void wmerge(Key* xs, int i, int m, int j, int n, int w) {
while (i < m && j < n)
swap(xs, w++, xs[i] < xs[j] ? i++ : j++);
while (i < m)
swap(xs, w++, i++);
while (j < n)
swap(xs, w++, j++);
}
它采用数组xs
,两个排序的子数组分别表示为range [i, m)
和[j, n)
。工作区从开始w
。与大多数教科书中给出的标准合并算法相比,这一算法在排序后的子数组和工作区域之间交换内容。结果,前一个工作区包含合并的排序元素,而存储在工作区中的前一个元素被移动到两个子数组。
但是,必须满足两个约束:
定义了这种合并算法后,就很容易想到一个解决方案,该解决方案可以对数组的一半进行排序。下一个问题是,如何处理工作区中存储的其余未分类零件,如下所示:
... unsorted 1/2 array ... | ... sorted 1/2 array ...
一个直观的想法是对工作区域的另一半进行递归排序,因此只有1/4的元素尚未排序。
... unsorted 1/4 array ... | sorted 1/4 array B | sorted 1/2 array A ...
此阶段的关键点是我们迟早必须将排序后的1/4元素B与排序后的1/2元素A合并。
是否剩下仅容纳1/4个元素的工作区域,该区域足够大以合并A和B?不幸的是,事实并非如此。
但是,上面提到的第二个约束条件给了我们一个提示,如果我们可以确保合并顺序确保未合并的元素不会被覆盖,则可以通过将工作区域安排为与任一子数组重叠来利用它。
实际上,我们可以对前半部分进行排序,而不是对工作区域的后半部分进行排序,然后将工作区域放在两个排序后的数组之间,如下所示:
... sorted 1/4 array B | unsorted work area | ... sorted 1/2 array A ...
这种设置有效地安排了工作区域与子阵列A的重叠。这种想法在[Jyrki Katajainen,Tomi Pasanen,Jukka Teuhola中提出。``实际就地合并排序''。北欧计算杂志,1996]。
因此,剩下的唯一事情就是重复上述步骤,从而将工作区域从1 / 2、1 / 4、1 / 8减小到……。当工作区域变得足够小时(例如,仅剩两个元素),我们可以切换到平凡的插入排序以结束此算法。
这是基于本文的ANSI C实现。
void imsort(Key* xs, int l, int u);
void swap(Key* xs, int i, int j) {
Key tmp = xs[i]; xs[i] = xs[j]; xs[j] = tmp;
}
/*
* sort xs[l, u), and put result to working area w.
* constraint, len(w) == u - l
*/
void wsort(Key* xs, int l, int u, int w) {
int m;
if (u - l > 1) {
m = l + (u - l) / 2;
imsort(xs, l, m);
imsort(xs, m, u);
wmerge(xs, l, m, m, u, w);
}
else
while (l < u)
swap(xs, l++, w++);
}
void imsort(Key* xs, int l, int u) {
int m, n, w;
if (u - l > 1) {
m = l + (u - l) / 2;
w = l + u - m;
wsort(xs, l, m, w); /* the last half contains sorted elements */
while (w - l > 2) {
n = w;
w = l + (n - l + 1) / 2;
wsort(xs, w, n, l); /* the first half of the previous working area contains sorted elements */
wmerge(xs, l, l + n - w, n, u, w);
}
for (n = w; n > l; --n) /*switch to insertion sort*/
for (m = n; m < u && xs[m] < xs[m-1]; ++m)
swap(xs, m, m - 1);
}
}
wmerge先前定义的位置。
顺便说一句,该版本不是最快的合并排序,因为它需要更多的交换操作。根据我的测试,它比标准版本要快,后者在每次递归中都会分配额外的空间。但这比优化版本要慢,后者要预先将原始数组加倍并将其用于进一步合并。
Knuth left this as an exercise (Vol 3, 5.2.5).
指前。13. [40] 实现建议的内部排序方法(在本节结尾),该方法将以 O(N)个时间单位对随机数据进行排序,仅对 O(sqrt(N))个附加存储位置进行排序。?(40表示相当困难或冗长的问题,可能适合在课堂中作为学期项目。)
包括其“大结果”,本文描述了就地合并排序(PDF)的几个变体:
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.22.5514&rep=rep1&type=pdf
更少的移动就地排序
Jyrki Katajainen,Tomi A.Pasanen
结果表明,可以使用O(1)个额外空间对n个元素的数组进行排序,将O(n log n / log log n)个元素移动,并进行n log 2 n + O(n log log n)个比较。这是第一种在最坏的情况下需要o(n log n)个移动同时保证O(n log n)比较的就地排序算法,但是由于所涉及的常数因素,该算法主要具有理论价值。
我认为这也很重要。我有它的打印输出,被一位同事传给我,但我还没有看过。它似乎涵盖了基础理论,但是我对这个话题不够熟悉,无法全面判断:
http://comjnl.oxfordjournals.org/cgi/content/abstract/38/8/681
最佳稳定合并
安东尼奥·西蒙尼斯
本文说明如何稳定地合并两个大小分别为m和n,m≤n的序列A和B,并分配O(m + n),比较O(mlog(n / m + 1))和仅使用常数额外的空间量。此结果匹配所有已知的下限...
这确实不是容易或高效的,我建议您除非确实需要,否则不要这样做(并且除非您是家庭作业,否则您可能不必这样做,因为就地合并的应用大部分是理论上的)。您不能使用quicksort吗?无论如何,Quicksort都会通过一些更简单的优化而更快,并且其额外的内存为O(log N)。
无论如何,如果必须这样做,那么就必须这样做。这是我发现的:一和二。我不熟悉就地合并排序,但是似乎基本的想法是使用旋转方便地合并两个数组,而无需使用额外的内存。
请注意,这比没有适当位置的经典合并排序要慢。
关键步骤是使合并本身就位。这并不像那些消息来源所讲的那么困难,但是当您尝试尝试时会失去一些东西。
查看合并的一个步骤:
[...列表排序 ... | x ...列表-A ... | y ...列表-B ...]
我们知道排序后的序列小于所有其他内容,x小于A中的所有其他内容,并且y小于B中的其他所有内容。在x小于或等于y的情况下,只需将指针移动到A的开头就可以了。在y小于x的情况下,您必须将y洗牌超过整个A进行排序。最后一步使价格昂贵(在退化的情况下除外)。
通常便宜一些(特别是当数组每个元素实际上只包含一个单词,例如,指向字符串或结构的指针时),以节省一些时间,并有一个单独的临时数组,您可以在它们之间来回排序。
#define SWAP(type, a, b) \
do { type t=(a);(a)=(b);(b)=t; } while (0)
static void reverse_(int* a, int* b)
{
for ( --b; a < b; a++, b-- )
SWAP(int, *a, *b);
}
static int* rotate_(int* a, int* b, int* c)
/* swap the sequence [a,b) with [b,c). */
{
if (a != b && b != c)
{
reverse_(a, b);
reverse_(b, c);
reverse_(a, c);
}
return a + (c - b);
}
static int* lower_bound_(int* a, int* b, const int key)
/* find first element not less than @p key in sorted sequence or end of
* sequence (@p b) if not found. */
{
int i;
for ( i = b-a; i != 0; i /= 2 )
{
int* mid = a + i/2;
if (*mid < key)
a = mid + 1, i--;
}
return a;
}
static int* upper_bound_(int* a, int* b, const int key)
/* find first element greater than @p key in sorted sequence or end of
* sequence (@p b) if not found. */
{
int i;
for ( i = b-a; i != 0; i /= 2 )
{
int* mid = a + i/2;
if (*mid <= key)
a = mid + 1, i--;
}
return a;
}
static void ip_merge_(int* a, int* b, int* c)
/* inplace merge. */
{
int n1 = b - a;
int n2 = c - b;
if (n1 == 0 || n2 == 0)
return;
if (n1 == 1 && n2 == 1)
{
if (*b < *a)
SWAP(int, *a, *b);
}
else
{
int* p, * q;
if (n1 <= n2)
p = upper_bound_(a, b, *(q = b+n2/2));
else
q = lower_bound_(b, c, *(p = a+n1/2));
b = rotate_(p, b, q);
ip_merge_(a, p, b);
ip_merge_(b, q, c);
}
}
void mergesort(int* v, int n)
{
if (n > 1)
{
int h = n/2;
mergesort(v, h); mergesort(v+h, n-h);
ip_merge_(v, v+h, v+n);
}
}
添加支持代码和修改,以在任何大小的辅助缓冲区可用时加速合并(无需额外的内存即可工作)。使用向前和向后合并,环旋转,小序列合并和排序以及迭代合并排序。
#include <stdlib.h>
#include <string.h>
static int* copy_(const int* a, const int* b, int* out)
{
int count = b - a;
if (a != out)
memcpy(out, a, count*sizeof(int));
return out + count;
}
static int* copy_backward_(const int* a, const int* b, int* out)
{
int count = b - a;
if (b != out)
memmove(out - count, a, count*sizeof(int));
return out - count;
}
static int* merge_(const int* a1, const int* b1, const int* a2,
const int* b2, int* out)
{
while ( a1 != b1 && a2 != b2 )
*out++ = (*a1 <= *a2) ? *a1++ : *a2++;
return copy_(a2, b2, copy_(a1, b1, out));
}
static int* merge_backward_(const int* a1, const int* b1,
const int* a2, const int* b2, int* out)
{
while ( a1 != b1 && a2 != b2 )
*--out = (*(b1-1) > *(b2-1)) ? *--b1 : *--b2;
return copy_backward_(a1, b1, copy_backward_(a2, b2, out));
}
static unsigned int gcd_(unsigned int m, unsigned int n)
{
while ( n != 0 )
{
unsigned int t = m % n;
m = n;
n = t;
}
return m;
}
static void rotate_inner_(const int length, const int stride,
int* first, int* last)
{
int* p, * next = first, x = *first;
while ( 1 )
{
p = next;
if ((next += stride) >= last)
next -= length;
if (next == first)
break;
*p = *next;
}
*p = x;
}
static int* rotate_(int* a, int* b, int* c)
/* swap the sequence [a,b) with [b,c). */
{
if (a != b && b != c)
{
int n1 = c - a;
int n2 = b - a;
int* i = a;
int* j = a + gcd_(n1, n2);
for ( ; i != j; i++ )
rotate_inner_(n1, n2, i, c);
}
return a + (c - b);
}
static void ip_merge_small_(int* a, int* b, int* c)
/* inplace merge.
* @note faster for small sequences. */
{
while ( a != b && b != c )
if (*a <= *b)
a++;
else
{
int* p = b+1;
while ( p != c && *p < *a )
p++;
rotate_(a, b, p);
b = p;
}
}
static void ip_merge_(int* a, int* b, int* c, int* t, const int ts)
/* inplace merge.
* @note works with or without additional memory. */
{
int n1 = b - a;
int n2 = c - b;
if (n1 <= n2 && n1 <= ts)
{
merge_(t, copy_(a, b, t), b, c, a);
}
else if (n2 <= ts)
{
merge_backward_(a, b, t, copy_(b, c, t), c);
}
/* merge without buffer. */
else if (n1 + n2 < 48)
{
ip_merge_small_(a, b, c);
}
else
{
int* p, * q;
if (n1 <= n2)
p = upper_bound_(a, b, *(q = b+n2/2));
else
q = lower_bound_(b, c, *(p = a+n1/2));
b = rotate_(p, b, q);
ip_merge_(a, p, b, t, ts);
ip_merge_(b, q, c, t, ts);
}
}
static void ip_merge_chunk_(const int cs, int* a, int* b, int* t,
const int ts)
{
int* p = a + cs*2;
for ( ; p <= b; a = p, p += cs*2 )
ip_merge_(a, a+cs, p, t, ts);
if (a+cs < b)
ip_merge_(a, a+cs, b, t, ts);
}
static void smallsort_(int* a, int* b)
/* insertion sort.
* @note any stable sort with low setup cost will do. */
{
int* p, * q;
for ( p = a+1; p < b; p++ )
{
int x = *p;
for ( q = p; a < q && x < *(q-1); q-- )
*q = *(q-1);
*q = x;
}
}
static void smallsort_chunk_(const int cs, int* a, int* b)
{
int* p = a + cs;
for ( ; p <= b; a = p, p += cs )
smallsort_(a, p);
smallsort_(a, b);
}
static void mergesort_lower_(int* v, int n, int* t, const int ts)
{
int cs = 16;
smallsort_chunk_(cs, v, v+n);
for ( ; cs < n; cs *= 2 )
ip_merge_chunk_(cs, v, v+n, t, ts);
}
static void* get_buffer_(int size, int* final)
{
void* p = NULL;
while ( size != 0 && (p = malloc(size)) == NULL )
size /= 2;
*final = size;
return p;
}
void mergesort(int* v, int n)
{
/* @note buffer size may be in the range [0,(n+1)/2]. */
int request = (n+1)/2 * sizeof(int);
int actual;
int* t = (int*) get_buffer_(request, &actual);
/* @note allocation failure okay. */
int tsize = actual / sizeof(int);
mergesort_lower_(v, n, t, tsize);
free(t);
}
这个答案有一个代码示例,该示例实现了黄冰超和Michael A. Langston 在论文《实用就地合并》中描述的算法。我不得不承认我不了解细节,但是合并步骤的给定复杂度为O(n)。
从实践的角度来看,有证据表明,在现场场景中,纯就地实现的效果不佳。例如,C ++标准定义了std :: inplace_merge,顾名思义就是就地合并操作。
假设C ++库通常进行了很好的优化,那么有趣的是如何实现它:
该实现委托给__inplace_merge,它通过尝试分配一个临时缓冲区来避免该问题:
typedef _Temporary_buffer<_BidirectionalIterator, _ValueType> _TmpBuf;
_TmpBuf __buf(__first, __len1 + __len2);
if (__buf.begin() == 0)
std::__merge_without_buffer
(__first, __middle, __last, __len1, __len2, __comp);
else
std::__merge_adaptive
(__first, __middle, __last, __len1, __len2, __buf.begin(),
_DistanceType(__buf.size()), __comp);
否则,它将退回到实现(__merge_without_buffer),该实现不需要额外的内存,但不再需要O(n)的时间运行。
看起来很像。它委托给一个函数,该函数还尝试分配缓冲区。根据是否有足够的元素,它将选择实现。常量内存后备函数称为__buffered_inplace_merge。
甚至后备时间仍然是O(n)时间,但要点是,如果有临时内存可用,它们将不使用实现。
请注意,C ++标准通过将所需的复杂度从O(n)降低到O(N log N),明确地为实现提供了选择此方法的自由:
复杂度: 如果有足够的额外内存可用,则为N-1个比较。如果内存不足,则进行O(N log N)比较。
当然,这不能作为不应该使用O(n)时间的恒定空间就地合并的证明。另一方面,如果速度更快,则优化的C ++库可能会切换到该类型的实现。
这是我的C版本:
void mergesort(int *a, int len) {
int temp, listsize, xsize;
for (listsize = 1; listsize <= len; listsize*=2) {
for (int i = 0, j = listsize; (j+listsize) <= len; i += (listsize*2), j += (listsize*2)) {
merge(& a[i], listsize, listsize);
}
}
listsize /= 2;
xsize = len % listsize;
if (xsize > 1)
mergesort(& a[len-xsize], xsize);
merge(a, listsize, xsize);
}
void merge(int *a, int sizei, int sizej) {
int temp;
int ii = 0;
int ji = sizei;
int flength = sizei+sizej;
for (int f = 0; f < (flength-1); f++) {
if (sizei == 0 || sizej == 0)
break;
if (a[ii] < a[ji]) {
ii++;
sizei--;
}
else {
temp = a[ji];
for (int z = (ji-1); z >= ii; z--)
a[z+1] = a[z];
ii++;
a[f] = temp;
ji++;
sizej--;
}
}
}
使用Kronrod的原始技术有一个相对简单的就地合并排序实现,但是实现起来比较简单。可以在以下位置找到说明此技术的图形示例:http : //www.logiccoder.com/TheSortProblem/BestMergeInfo.htm。
也有链接指向同一作者的更详细的理论分析,与此链接相关。
我只是使用插入排序算法尝试了JAVA中用于合并排序的就地合并算法,使用以下步骤。
1)有两个排序的数组。
2)比较每个数组的第一个值;并将最小值放入第一个数组中。
3)通过使用插入排序(从左到右遍历)将较大的值放入第二个数组。
4)然后再次比较第一个数组的第二个值和第二个数组的第一个值,并执行相同的操作。但是,当发生交换时,有一些线索可以跳过对其他项目的比较,而只是交换是必需的。
我在这里做了一些优化。在插入排序中保留较少的比较。
我发现此解决方案的唯一缺点是,它需要在第二个数组中交换更大的数组元素。
例如)
First___Array:3,7,8,9
第二数组:1,2,4,5
然后,7、8、9使第二个数组每次交换(向左移动)所有元素一次,以使自己位于最后一个数组中。
因此,与两个项目的比较相比,此处交换项目的假设可以忽略不计。
https://github.com/skanagavelu/algorithams/blob/master/src/sorting/MergeSort.java
package sorting;
import java.util.Arrays;
public class MergeSort {
public static void main(String[] args) {
int[] array = { 5, 6, 10, 3, 9, 2, 12, 1, 8, 7 };
mergeSort(array, 0, array.length -1);
System.out.println(Arrays.toString(array));
int[] array1 = {4, 7, 2};
System.out.println(Arrays.toString(array1));
mergeSort(array1, 0, array1.length -1);
System.out.println(Arrays.toString(array1));
System.out.println("\n\n");
int[] array2 = {4, 7, 9};
System.out.println(Arrays.toString(array2));
mergeSort(array2, 0, array2.length -1);
System.out.println(Arrays.toString(array2));
System.out.println("\n\n");
int[] array3 = {4, 7, 5};
System.out.println(Arrays.toString(array3));
mergeSort(array3, 0, array3.length -1);
System.out.println(Arrays.toString(array3));
System.out.println("\n\n");
int[] array4 = {7, 4, 2};
System.out.println(Arrays.toString(array4));
mergeSort(array4, 0, array4.length -1);
System.out.println(Arrays.toString(array4));
System.out.println("\n\n");
int[] array5 = {7, 4, 9};
System.out.println(Arrays.toString(array5));
mergeSort(array5, 0, array5.length -1);
System.out.println(Arrays.toString(array5));
System.out.println("\n\n");
int[] array6 = {7, 4, 5};
System.out.println(Arrays.toString(array6));
mergeSort(array6, 0, array6.length -1);
System.out.println(Arrays.toString(array6));
System.out.println("\n\n");
//Handling array of size two
int[] array7 = {7, 4};
System.out.println(Arrays.toString(array7));
mergeSort(array7, 0, array7.length -1);
System.out.println(Arrays.toString(array7));
System.out.println("\n\n");
int input1[] = {1};
int input2[] = {4,2};
int input3[] = {6,2,9};
int input4[] = {6,-1,10,4,11,14,19,12,18};
System.out.println(Arrays.toString(input1));
mergeSort(input1, 0, input1.length-1);
System.out.println(Arrays.toString(input1));
System.out.println("\n\n");
System.out.println(Arrays.toString(input2));
mergeSort(input2, 0, input2.length-1);
System.out.println(Arrays.toString(input2));
System.out.println("\n\n");
System.out.println(Arrays.toString(input3));
mergeSort(input3, 0, input3.length-1);
System.out.println(Arrays.toString(input3));
System.out.println("\n\n");
System.out.println(Arrays.toString(input4));
mergeSort(input4, 0, input4.length-1);
System.out.println(Arrays.toString(input4));
System.out.println("\n\n");
}
private static void mergeSort(int[] array, int p, int r) {
//Both below mid finding is fine.
int mid = (r - p)/2 + p;
int mid1 = (r + p)/2;
if(mid != mid1) {
System.out.println(" Mid is mismatching:" + mid + "/" + mid1+ " for p:"+p+" r:"+r);
}
if(p < r) {
mergeSort(array, p, mid);
mergeSort(array, mid+1, r);
// merge(array, p, mid, r);
inPlaceMerge(array, p, mid, r);
}
}
//Regular merge
private static void merge(int[] array, int p, int mid, int r) {
int lengthOfLeftArray = mid - p + 1; // This is important to add +1.
int lengthOfRightArray = r - mid;
int[] left = new int[lengthOfLeftArray];
int[] right = new int[lengthOfRightArray];
for(int i = p, j = 0; i <= mid; ){
left[j++] = array[i++];
}
for(int i = mid + 1, j = 0; i <= r; ){
right[j++] = array[i++];
}
int i = 0, j = 0;
for(; i < left.length && j < right.length; ) {
if(left[i] < right[j]){
array[p++] = left[i++];
} else {
array[p++] = right[j++];
}
}
while(j < right.length){
array[p++] = right[j++];
}
while(i < left.length){
array[p++] = left[i++];
}
}
//InPlaceMerge no extra array
private static void inPlaceMerge(int[] array, int p, int mid, int r) {
int secondArrayStart = mid+1;
int prevPlaced = mid+1;
int q = mid+1;
while(p < mid+1 && q <= r){
boolean swapped = false;
if(array[p] > array[q]) {
swap(array, p, q);
swapped = true;
}
if(q != secondArrayStart && array[p] > array[secondArrayStart]) {
swap(array, p, secondArrayStart);
swapped = true;
}
//Check swapped value is in right place of second sorted array
if(swapped && secondArrayStart+1 <= r && array[secondArrayStart+1] < array[secondArrayStart]) {
prevPlaced = placeInOrder(array, secondArrayStart, prevPlaced);
}
p++;
if(q < r) { //q+1 <= r) {
q++;
}
}
}
private static int placeInOrder(int[] array, int secondArrayStart, int prevPlaced) {
int i = secondArrayStart;
for(; i < array.length; i++) {
//Simply swap till the prevPlaced position
if(secondArrayStart < prevPlaced) {
swap(array, secondArrayStart, secondArrayStart+1);
secondArrayStart++;
continue;
}
if(array[i] < array[secondArrayStart]) {
swap(array, i, secondArrayStart);
secondArrayStart++;
} else if(i != secondArrayStart && array[i] > array[secondArrayStart]){
break;
}
}
return secondArrayStart;
}
private static void swap(int[] array, int m, int n){
int temp = array[m];
array[m] = array[n];
array[n] = temp;
}
}