以最佳方式在二进制搜索树中找到第k个最小元素


112

我需要在二进制搜索树中找到第k个最小的元素,而无需使用任何静态/全局变量。如何有效实现?我想到的解决方案是在O(n)中进行操作,这是最糟糕的情况,因为我计划对整个树进行有序遍历。但在内心深处,我觉得我没有在这里使用BST属性。我的假设解决方案正确还是有更好的解决方案?


7
树平衡了吗?
kennytm

不是。但是,如果达到平衡,是否有最佳方法?
bragboy

1
如果您在“订单统计”上进行搜索,则会找到所需的内容。
RAL 2010年

我有点以下感觉,而正确答案却是作弊,因为它们使用某种全局变量(无论是对整数的引用,还是对变量进行递减并返回)。如果绝对这些都不是允许的,我会用递归没有传递任何引用。
亨利照

Answers:


170

这只是一个想法的概述:

在BST中,节点的左子树T仅包含小于中存储的值的元素T。如果k小于左侧子树中的元素数,则k第最小元素必须属于左侧子树。否则,如果k较大,则k最小的元素在右子树中。

我们可以扩展BST,使其中的每个节点都在其左侧子树中存储元素数(假设给定节点的左侧子树包括该节点)。有了这些信息,很容易遍历树,方法是反复询问左子树中的元素数,以决定是否要递归到左子树或右子树中。

现在,假设我们在节点T上:

  1. 如果k == num_elements(T的左子树),那么我们正在寻找的答案是node中的值T
  2. 如果k> num_elements(T的左子树),那么显然我们可以忽略左子树,因为那些元素也将小于k最小的th。因此,我们将问题简化为找到k - num_elements(left subtree of T)正确的子树的最小元素。
  3. 如果k <num_elements(T的左子树),则第kth k个最小元素在左子树中的某处,因此我们将问题简化为在左子树中找到第th个最小元素。

复杂度分析:

这需要O(depth of node)时间,这O(log n)在平衡的BST上最差,O(log n)对于随机BST则平均。

BST需要O(n)存储,而另一个则需要O(n)存储有关元素数量的信息。所有BST操作都需要O(depth of node)时间,并且需要花费O(depth of node)额外的时间来维护“元素数量”信息以用于节点的插入,删除或旋转。因此,在左子树中存储有关元素数量的信息可保持BST的空间和时间复杂性。


59
要找到第N个最小项,您只需存储左子树的大小。如果您还希望能够找到第N个最大项,则可以使用正确的子树的大小。实际上,您可以降低成本:将树的总大小存储在根目录中,并将左子树的大小存储。当需要确定右子树的大小时,可以从总大小中减去左子树的大小。
杰里·科芬

37
这种增强的BST被称为“订单统计树”。
丹尼尔(Daniel)2010年

10
@Ivlad:在第2步中,我认为“ k-num_elements”应为“ k-num_elements -1”,因为您还必须包括根元素。
understack

1
@understack-如果您假设根是子树的一部分,则不是。
IVlad

16
如果树不包含包含“其左子树和右子树中的元素数”的字段,则该方法将最终为BigO(n),因为您需要在每个节点处遍历右子树或左子树才能计算当前节点的k索引。
罗伯特·巴恩斯

68

一个更简单的解决方案是进行有序遍历并跟踪当前要打印的元素(不打印)。当我们达到k时,打印该元素并跳过其余的树遍历。

void findK(Node* p, int* k) {
  if(!p || k < 0) return;
  findK(p->left, k);
  --k;
  if(k == 0) { 
    print p->data;
    return;  
  } 
  findK(p->right, k); 
}

1
+1:想法正确,但可能需要拧紧一些松动的末端;参见stackoverflow.com/a/23069077/278326
Arun

1
我喜欢这种解决方案,因为已经订购了BST,所以遍历就足够了。
Merlin 2015年

3
如果n接近该树中节点的总数,则您的算法将花费O(n)时间来完成,这对于所选的答案-O(log n)是不利的
Spark8006 2015年

13
public int ReturnKthSmallestElement1(int k)
    {
        Node node = Root;

        int count = k;

        int sizeOfLeftSubtree = 0;

        while(node != null)
        {

            sizeOfLeftSubtree = node.SizeOfLeftSubtree();

            if (sizeOfLeftSubtree + 1 == count)
                return node.Value;
            else if (sizeOfLeftSubtree < count)
            {
                node = node.Right;
                count -= sizeOfLeftSubtree+1;
            }
            else
            {
                node = node.Left;
            }
        }

        return -1;
    }

这是我基于上述算法在C#中的实现,只是以为我会发布它,以便人们可以更好地理解它对我有用

谢谢你IVlad


11

一个更简单的解决方案是进行有序遍历并使用计数器k跟踪当前要打印的元素。当我们达到k时,打印元素。运行时间为O(n)。请记住,函数的返回类型不能为空,它必须在每次递归调用后返回其更新的k值。更好的解决方案是在每个节点上使用排序位置值的增强BST。

public static int kthSmallest (Node pivot, int k){
    if(pivot == null )
        return k;   
    k = kthSmallest(pivot.left, k);
    k--;
    if(k == 0){
        System.out.println(pivot.value);
    }
    k = kthSmallest(pivot.right, k);
    return k;
}

我猜您的解决方案在空间复杂度方面要比增强型BST更好。
zach

即使找到第k个最小元素,搜索也不会停止。
Vineeth Chitteti,

10

//添加Java版本而不递归

public static <T> void find(TreeNode<T> node, int num){
    Stack<TreeNode<T>> stack = new Stack<TreeNode<T>>();

    TreeNode<T> current = node;
    int tmp = num;

    while(stack.size() > 0 || current!=null){
        if(current!= null){
            stack.add(current);
            current = current.getLeft();
        }else{
            current = stack.pop();
            tmp--;

            if(tmp == 0){
                System.out.println(current.getValue());
                return;
            }

            current = current.getRight();
        }
    }
}

我喜欢这种解决方案和相应的递归解决方案。老实说,这个问题的大多数答案太混乱/太复杂了,难以阅读。
亨利·邱

我喜欢这个解决方案!清晰而伟大!
Rugal 2015年

此解决方案是“按顺序”遍历树并在访问节点后减少计数器,以在计数器等于零时停止。那么最坏的情况是O(n)。与@IVlad的递归解相比,它不是最佳选择,后者的最坏情况为O(log n)
Jorge


4

仅给出普通的二进制搜索树,您所能做的就是从最小的树开始,然后向上遍历以找到合适的节点。

如果要经常执行此操作,则可以向每个节点添加一个属性,以指示其左侧子树中有多少个节点。使用它,您可以将树直接降到正确的节点。


4

带计数器的递归有序行走

Time Complexity: O( N ), N is the number of nodes
Space Complexity: O( 1 ), excluding the function call stack

这个想法类似于@prasadvk解决方案,但是它有一些缺点(请参阅下面的注释),因此我将其作为单独的答案发布。

// Private Helper Macro
#define testAndReturn( k, counter, result )                         \
    do { if( (counter == k) && (result == -1) ) {                   \
        result = pn->key_;                                          \
        return;                                                     \
    } } while( 0 )

// Private Helper Function
static void findKthSmallest(
    BstNode const * pn, int const k, int & counter, int & result ) {

    if( ! pn ) return;

    findKthSmallest( pn->left_, k, counter, result );
    testAndReturn( k, counter, result );

    counter += 1;
    testAndReturn( k, counter, result );

    findKthSmallest( pn->right_, k, counter, result );
    testAndReturn( k, counter, result );
}

// Public API function
void findKthSmallest( Bst const * pt, int const k ) {
    int counter = 0;
    int result = -1;        // -1 := not found
    findKthSmallest( pt->root_, k, counter, result );
    printf("%d-th element: element = %d\n", k, result );
}

注意事项(以及与@prasadvk解决方案的区别):

  1. if( counter == k )需要在三个位置进行测试:(a)在左子树之后,(b)在根树之后,以及(c)在右子树之后。这是为了确保在所有位置都检测到第k个元素,即与它所在的子树无关。

  2. if( result == -1 )必须进行测试以确保仅打印结果元素,否则将打印从最小的第k个字符到根的所有元素。


此解决方案的时间复杂度为O(k + d),其中d树的最大深度。因此,它使用全局变量,counter但是对于该问题是非法的。
Valentin Shergin

嗨,阿伦,您能举例说明一下。我尤其不明白你的第一点。
Andy897

3

对于没有平衡搜索树,它需要为O(n)

对于平衡搜索树,在最坏的情况下它需要O(k + log n),但在摊销意义上仅需要O(k)

为每个节点拥有并管理额外的整数:子树的大小使O(log n)时间复杂。这种平衡的搜索树通常称为RankTree。

通常,有解决方案(不是基于树)。

问候。


1

这可以很好地工作:status:是用于保存是否找到元素的数组。k:是要找到的第k个元素。count:跟踪遍历树期间遍历的节点数。

int kth(struct tree* node, int* status, int k, int count)
{
    if (!node) return count;
    count = kth(node->lft, status, k, count);  
    if( status[1] ) return status[0];
    if (count == k) { 
        status[0] = node->val;
        status[1] = 1;
        return status[0];
    }
    count = kth(node->rgt, status, k, count+1);
    if( status[1] ) return status[0];
    return count;
}

1

尽管这绝对不是解决问题的最佳方法,但它是另一种潜在的解决方案,我认为有些人可能会觉得有趣:

/**
 * Treat the bst as a sorted list in descending order and find the element 
 * in position k.
 *
 * Time complexity BigO ( n^2 )
 *
 * 2n + sum( 1 * n/2 + 2 * n/4 + ... ( 2^n-1) * n/n ) = 
 * 2n + sigma a=1 to n ( (2^(a-1)) * n / 2^a ) = 2n + n(n-1)/4
 *
 * @param t The root of the binary search tree.
 * @param k The position of the element to find.
 * @return The value of the element at position k.
 */
public static int kElement2( Node t, int k ) {
    int treeSize = sizeOfTree( t );

    return kElement2( t, k, treeSize, 0 ).intValue();
}

/**
 * Find the value at position k in the bst by doing an in-order traversal 
 * of the tree and mapping the ascending order index to the descending order 
 * index.
 *
 *
 * @param t Root of the bst to search in.
 * @param k Index of the element being searched for.
 * @param treeSize Size of the entire bst.
 * @param count The number of node already visited.
 * @return Either the value of the kth node, or Double.POSITIVE_INFINITY if 
 *         not found in this sub-tree.
 */
private static Double kElement2( Node t, int k, int treeSize, int count ) {
    // Double.POSITIVE_INFINITY is a marker value indicating that the kth 
    // element wasn't found in this sub-tree.
    if ( t == null )
        return Double.POSITIVE_INFINITY;

    Double kea = kElement2( t.getLeftSon(), k, treeSize, count );

    if ( kea != Double.POSITIVE_INFINITY )
        return kea;

    // The index of the current node.
    count += 1 + sizeOfTree( t.getLeftSon() );

    // Given any index from the ascending in order traversal of the bst, 
    // treeSize + 1 - index gives the
    // corresponding index in the descending order list.
    if ( ( treeSize + 1 - count ) == k )
        return (double)t.getNumber();

    return kElement2( t.getRightSon(), k, treeSize, count );
}

1

签名:

Node * find(Node* tree, int *n, int k);

呼叫为:

*n = 0;
kthNode = find(root, n, k);

定义:

Node * find ( Node * tree, int *n, int k)
{
   Node *temp = NULL;

   if (tree->left && *n<k)
      temp = find(tree->left, n, k);

   *n++;

   if(*n==k)
      temp = root;

   if (tree->right && *n<k)
      temp = find(tree->right, n, k);

   return temp;
}

1

好吧,这是我的2美分...

int numBSTnodes(const Node* pNode){
     if(pNode == NULL) return 0;
     return (numBSTnodes(pNode->left)+numBSTnodes(pNode->right)+1);
}


//This function will find Kth smallest element
Node* findKthSmallestBSTelement(Node* root, int k){
     Node* pTrav = root;
     while(k > 0){
         int numNodes = numBSTnodes(pTrav->left);
         if(numNodes >= k){
              pTrav = pTrav->left;
         }
         else{
              //subtract left tree nodes and root count from 'k'
              k -= (numBSTnodes(pTrav->left) + 1);
              if(k == 0) return pTrav;
              pTrav = pTrav->right;
        }

        return NULL;
 }

0

这就是我的工作原理。它将在o(log n)中运行

public static int FindkThSmallestElemet(Node root, int k)
    {
        int count = 0;
        Node current = root;

        while (current != null)
        {
            count++;
            current = current.left;
        }
        current = root;

        while (current != null)
        {
            if (count == k)
                return current.data;
            else
            {
                current = current.left;
                count--;
            }
        }

        return -1;


    } // end of function FindkThSmallestElemet

3
我认为此解决方案不起作用。如果第K个最小树在树节点的右子树中怎么办?
Anil Vishnoi

0

好吧,我们可以简单地使用顺序遍历并将访问的元素压入堆栈。弹出k次,以获得答案。

我们也可以在k个元素之后停止


1
这不是最佳解决方案
bragboy 2011年

0

完整的BST案例的解决方案:-

Node kSmallest(Node root, int k) {
  int i = root.size(); // 2^height - 1, single node is height = 1;
  Node result = root;
  while (i - 1 > k) {
    i = (i-1)/2;  // size of left subtree
    if (k < i) {
      result = result.left;
    } else {
      result = result.right;
      k -= i;
    }  
  }
  return i-1==k ? result: null;
}


0

这是C#中的简洁版本,它返回第k个最小的元素,但需要将k作为ref参数传递(这与@prasadvk的方法相同):

Node FindSmall(Node root, ref int k)
{
    if (root == null || k < 1)
        return null;

    Node node = FindSmall(root.LeftChild, ref k);
    if (node != null)
        return node;

    if (--k == 0)
        return node ?? root;
    return FindSmall(root.RightChild, ref k);
}

它的O(log n)的发现最小的节点,然后O(K)穿越到k个节点,所以它的O(K + log n)的。


Java版本呢?
亨利·邱


0

我找不到更好的算法..所以决定写一个:)如果这是错误的,请纠正我。

class KthLargestBST{
protected static int findKthSmallest(BSTNode root,int k){//user calls this function
    int [] result=findKthSmallest(root,k,0);//I call another function inside
    return result[1];
}
private static int[] findKthSmallest(BSTNode root,int k,int count){//returns result[]2 array containing count in rval[0] and desired element in rval[1] position.
    if(root==null){
        int[]  i=new int[2];
        i[0]=-1;
        i[1]=-1;
        return i;
    }else{
        int rval[]=new int[2];
        int temp[]=new int[2];
        rval=findKthSmallest(root.leftChild,k,count);
        if(rval[0]!=-1){
            count=rval[0];
        }
        count++;
        if(count==k){
            rval[1]=root.data;
        }
        temp=findKthSmallest(root.rightChild,k,(count));
        if(temp[0]!=-1){
            count=temp[0];
        }
        if(temp[1]!=-1){
            rval[1]=temp[1];
        }
        rval[0]=count;
        return rval;
    }
}
public static void main(String args[]){
    BinarySearchTree bst=new BinarySearchTree();
    bst.insert(6);
    bst.insert(8);
    bst.insert(7);
    bst.insert(4);
    bst.insert(3);
    bst.insert(4);
    bst.insert(1);
    bst.insert(12);
    bst.insert(18);
    bst.insert(15);
    bst.insert(16);
    bst.inOrderTraversal();
    System.out.println();
    System.out.println(findKthSmallest(bst.root,11));
}

}


0

这是Java代码,

max(Node root,int k) -查找第k个最大值

min(Node root,int k) -查找最小的kth

static int count(Node root){
    if(root == null)
        return 0;
    else
        return count(root.left) + count(root.right) +1;
}
static int max(Node root, int k) {
    if(root == null)
        return -1;
    int right= count(root.right);

    if(k == right+1)
        return root.data;
    else if(right < k)
        return max(root.left, k-right-1);
    else return max(root.right, k);
}

static int min(Node root, int k) {
    if (root==null)
        return -1;

    int left= count(root.left);
    if(k == left+1)
        return root.data;
    else if (left < k)
        return min(root.right, k-left-1);
    else
        return min(root.left, k);
}

0

这也可以。只需在树中用maxNode调用函数

def k_largest(self,node,k):如果k <0:
如果k == 0则返回None :返回节点else:k-= 1返回self.k_largest(self.predecessor(node),k)


0

我认为这比接受的答案更好,因为它不需要修改原始树节点来存储其子节点的数量。

我们只需要使用有序遍历来从左到右计数最小的节点,一旦计数等于K,就停止搜索。

private static int count = 0;
public static void printKthSmallestNode(Node node, int k){
    if(node == null){
        return;
    }

    if( node.getLeftNode() != null ){
        printKthSmallestNode(node.getLeftNode(), k);
    }

    count ++ ;
    if(count <= k )
        System.out.println(node.getValue() + ", count=" + count + ", k=" + k);

    if(count < k  && node.getRightNode() != null)
        printKthSmallestNode(node.getRightNode(), k);
}

0

最好的方法已经存在,但是我想为此添加一个简单的代码

int kthsmallest(treenode *q,int k){
int n = size(q->left) + 1;
if(n==k){
    return q->val;
}
if(n > k){
    return kthsmallest(q->left,k);
}
if(n < k){
    return kthsmallest(q->right,k - n);
}

}

int size(treenode *q){
if(q==NULL){
    return 0;
}
else{
    return ( size(q->left) + size(q->right) + 1 );
}}

0

使用辅助Result类跟踪是否找到了节点以及当前k。

public class KthSmallestElementWithAux {

public int kthsmallest(TreeNode a, int k) {
    TreeNode ans = kthsmallestRec(a, k).node;
    if (ans != null) {
        return ans.val;
    } else {
        return -1;
    }
}

private Result kthsmallestRec(TreeNode a, int k) {
    //Leaf node, do nothing and return
    if (a == null) {
        return new Result(k, null);
    }

    //Search left first
    Result leftSearch = kthsmallestRec(a.left, k);

    //We are done, no need to check right.
    if (leftSearch.node != null) {
        return leftSearch;
    }

    //Consider number of nodes found to the left
    k = leftSearch.k;

    //Check if current root is the solution before going right
    k--;
    if (k == 0) {
        return new Result(k - 1, a);
    }

    //Check right
    Result rightBalanced = kthsmallestRec(a.right, k);

    //Consider all nodes found to the right
    k = rightBalanced.k;

    if (rightBalanced.node != null) {
        return rightBalanced;
    }

    //No node found, recursion will continue at the higher level
    return new Result(k, null);

}

private class Result {
    private final int k;
    private final TreeNode node;

    Result(int max, TreeNode node) {
        this.k = max;
        this.node = node;
    }
}
}

0

Python解决方案时间复杂度:O(n)空间复杂度:O(1)

想法是使用莫里斯有序遍历

class Solution(object):
def inorderTraversal(self, current , k ):
    while(current is not None):    #This Means we have reached Right Most Node i.e end of LDR traversal

        if(current.left is not None):  #If Left Exists traverse Left First
            pre = current.left   #Goal is to find the node which will be just before the current node i.e predecessor of current node, let's say current is D in LDR goal is to find L here
            while(pre.right is not None and pre.right != current ): #Find predecesor here
                pre = pre.right
            if(pre.right is None):  #In this case predecessor is found , now link this predecessor to current so that there is a path and current is not lost
                pre.right = current
                current = current.left
            else:                   #This means we have traverse all nodes left to current so in LDR traversal of L is done
                k -= 1
                if(k == 0):
                    return current.val
                pre.right = None       #Remove the link tree restored to original here 
                current = current.right
        else:               #In LDR  LD traversal is done move to R 
            k -= 1
            if(k == 0):
                return current.val
            current = current.right

    return 0

def kthSmallest(self, root, k):
    return self.inorderTraversal( root , k  )

-1

我写了一个整洁的函数来计算第k个最小元素。我使用顺序遍历,并在到达第k个最小元素时停止。

void btree::kthSmallest(node* temp, int& k){
if( temp!= NULL)   {
 kthSmallest(temp->left,k);       
 if(k >0)
 {
     if(k==1)
    {
      cout<<temp->value<<endl;
      return;
    }

    k--;
 }

 kthSmallest(temp->right,k);  }}

没有提供关于为什么这是最佳的度量。在大型和小型的案件
Woot4Moo

-1
int RecPrintKSmallest(Node_ptr head,int k){
  if(head!=NULL){
    k=RecPrintKSmallest(head->left,k);
    if(k>0){
      printf("%c ",head->Node_key.key);
      k--;
    }
    k=RecPrintKSmallest(head->right,k);
  }
  return k;
}

2
请始终在代码中附带有关其功能以及如何帮助解决问题的描述。

-1
public TreeNode findKthElement(TreeNode root, int k){
    if((k==numberElement(root.left)+1)){
        return root;
    }
    else if(k>numberElement(root.left)+1){
        findKthElement(root.right,k-numberElement(root.left)-1);
    }
    else{
        findKthElement(root.left, k);
    }
}

public int numberElement(TreeNode node){
    if(node==null){
        return 0;
    }
    else{
        return numberElement(node.left) + numberElement(node.right) + 1;
    }
}

-1
public static Node kth(Node n, int k){
    Stack<Node> s=new Stack<Node>();
    int countPopped=0;
    while(!s.isEmpty()||n!=null){
      if(n!=null){
        s.push(n);
        n=n.left;
      }else{
        node=s.pop();
        countPopped++;
        if(countPopped==k){
            return node;
        }
        node=node.right;

      }
  }

}

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.