间隔图的数据结构

令 $n$ 为整数，令 $\mathbb{Z}$ 表示所有整数的集合。令 $[a,b]$ 表示整数的间隔 $\{a,a+1,a+2,\dots,b\}$ 。

我正在寻找一种数据结构来表示映射 $f:[1,n] \to \mathbb{Z}$ 。我希望数据结构支持以下操作：

$\text{get}(i)$ 应该返回 $f(i)$ 。
$\text{set}([a,b],y)$ 应更新 $f$ 使得 $f(a)=f(a+1)=\cdots=f(b)=y$ ，即更新 $f$ 到一个新的地图 $f'$ 使得 $f'(i) = y$ 用于 $i \in [a,b]$ 并且 $f'(i) = f(i)$ 为 $i \notin [a,b]$ 。
应该返回最大间隔，使得并且是常数（即，）。 $\text{stab}(i)$ $[a,b]$ $i \in [a,b]$ $f$ $[a,b]$ $f(a)=f(a+1)=\cdots=f(b)$
应更新到一个新的地图使得为并且为。 $\text{add}([a,b],\delta)$ $f$ $f'$ $f'(i) = f(i) + \delta$ $i \in [a,b]$ $f'(i) = f(i)$ $i \notin [a,b]$

我希望每个操作都高效。我认为 $O(1)$ 或 $O(\lg n)$ 时间是有效的，但是 $O(n)$ 时间太慢。如果运行时间是摊销的运行时间，则可以。是否有一种数据结构可以同时提高所有这些操作的效率？

（我注意到在一些编程挑战中也出现了类似的模式。这是一个概括，足以解决所有这些挑战问题。）

— DW
source

我猜八卦树是起点。虽然

add的子间隔数是线性的；您是否考虑过懒散压缩带有一元“

”节点的八叉树？

[a, b]

$[a,b]$

+ δ

$+\delta$

— 吉尔斯（Gilles）'所以

考虑

使得所有

，

。然后，您必须将

值存储在某个位置。执行

必须以某种方式摆脱这些值（通过重写或丢弃它们-您可以使用GC推迟执行，但有时必须执行

操作）。这样，该运算将为

。

f

$f$

f (i) \neq f (j)

$f(i)\neq f(j)$

i

$i$

j

$j$

n

$n$

set ([a, b], y)

$\text{set}([a,b],y)$

O (n)

$O(n)$

O (n)

$O(n)$

— avakar 2013年

@avakar，我对将GC视为有效的“免费”解决方案感到满意。更一般而言，我对解决方案感到满意，该解决方案将运行时间摊销为运行时间（因此，可以将GC的成本首先摊在创造价值的成本中）。

— DW

您注意到常数时间和对数时间有效，线性时间慢。将

时间是否太慢，无法满足您的需求？

O (\sqrt{n} \lg n)

$O(\sqrt{n} \lg n)$

— jbapple

@jbapple，嘿，这是一个开始！我认为值得记录作为答案。

— DW

我相信所有查询的对数时间都是可以实现的。主要思想是使用间隔树，其中树中的每个节点对应于索引间隔。我将从一个简单的数据结构版本开始（它可以支持get和set，但不支持其他操作）来构建关键思想，然后添加功能以支持其他功能。

一个简单的方案（支持获取和设置，但不支持添加或刺穿）

假设如果函数在上恒定，即，如果，则间隔是平坦的。 $[a,b]$ $f$ $[a,b]$ $f(a)=f(a+1)=\cdots =f(b)$

我们的简单数据结构将是一个间隔树。换句话说，我们有一个二叉树，其中每个节点对应一个（索引的）间隔。我们将在树的每个节点中存储相应的间隔。每片叶子将对应一个平坦的间隔，并且它们的排列方式将使得从左到右的读取叶子给我们提供了一系列连续的平坦间隔，这些间隔不相交并且其并集为。内部节点的间隔将为其两个子节点的间隔的并集。另外，在每个叶节点我们将存储值 $I(v)$ $v$ $[1,n]$ $\ell$ $V(\ell)$ 的函数在区间对应于该节点（请注意，此间隔是平的，所以是在间隔恒定，所以我们只储存的单个值在每个叶节点）。 $f$ $I(\ell)$ $f$ $f$

同样，您可以想象我们将划分为平坦的间隔，然后数据结构是一个二进制搜索树，其中的键是这些间隔的左端点。叶子含有的值在一些索引范围，其中是恒定的。 $[1,n]$ $f$ $f$

使用标准方法来确保二叉树保持平衡，即其深度为（其中表示树中当前的叶子数）。当然，，所以深度总是至多。下面将对您有所帮助。 $O(\lg m)$ $m$ $m\le n$ $O(\lg n)$

现在，我们可以支持以下get和set操作：

很简单：我们遍历树以查找其间隔包含的叶子。这基本上只是遍历二叉搜索树。由于深度是，运行时间是。 $\text{get}(i)$ $i$ $O(\lg n)$ $O(\lg n)$
比较棘手。它是这样的： $\text{set}([a,b],y)$
1. 首先，我们找到包含的叶间隔。如果，则我们将该叶子间隔分为和两个间隔（因此将此叶子节点转换为内部节点并引入两个子节点）。 $[a_0,b_0]$ $a$ $a_0 < a$ $[a_0,a-1]$ $[a,b_0]$
2. $[a_1,b_1]$ $b$ $b < b_1$ $[a_1,b]$ $[b+1,b_1]$
3. $[a,b]$ $O(\lg n)$ $O(\lg n)$ $y$
4. 最后，由于我们修改了树的形状，因此将执行任何必要的旋转以重新平衡树（使用任何标准技术来保持树的平衡）。
$O(\lg n)$ $O(\lg n)$ $O(\lg n)$

$O(\lg n)$ $O(\lg \min(n,s))$ $s$

添加对添加的支持

我们可以修改上面的数据结构，以便它也可以支持添加操作。特别是，不是将函数的值存储在叶子中，而是将其表示为存储在一组节点中的数字的总和。

更准确地说，输入处的函数的值将作为树的根向下到其间隔包含的叶子的路径上的节点中存储的值的总和而可恢复。在每个节点我们将存储一个值；如果表示叶的祖先（包括叶本身），则函数在值将是。 $f(i)$ $i$ $i$ $v$ $V(v)$ $v_0,v_1,\dots,v_k$ $v_k$ $I(v_k)$ $V(v_0)+\dots + V(v_k)$

使用上述技术的变体很容易支持get和set操作。基本上，当我们向下遍历树时，我们会跟踪运行中的值之和，因此对于遍历访问的每个节点，我们将知道从根到的路径上节点的值之和。一旦这样做，对上述get和set实现的简单调整就足够了。 $x$ $x$

现在我们可以有效地支持。首先，我们将间隔为与树中某些节点集相对应的间隔的并集如果需要，在左端点和右端点处拆分一个节点）），与设置操作的第1-3步完全相同。现在，我们只需将添加到存储在每个节点中的值即可。（我们不会删除其后代。） $\text{add}([a,b],\delta)$ $[a,b]$ $O(\lg n)$ $O(\lg n)$ $\delta$ $O(\lg n)$

这提供了一种在每次操作的时间内支持获取，设置和添加的方法。实际上，每个操作的运行时间为，其中表示设置操作的数量加上加法操作的数量。 $O(\lg n)$ $O(\lg \min(n,s))$ $s$

支持刺伤操作

刺刺查询是最困难的支持。基本思想是修改以上数据结构以保留以下附加不变式：

（*）与每个叶子对应的间隔是最大平坦间隔。 $I(\ell)$ $\ell$

在这里我说，如果（i）是平坦的，并且（ii）没有包含间隔是平坦的，则间隔是最大平坦间隔（换句话说，对于所有满足，或不平坦）。 $[a,b]$ $[a,b]$ $[a,b]$ $a',b'$ $1 \le a' \le a \le b \le b' \le n$ $[a',b']=[a,b]$ $[a',b']$

这使stab操作易于实现：

$\text{stab}(i)$ 查找其间隔包含的叶子，然后返回该间隔。 $i$

但是，现在我们需要修改集合并添加操作以保持不变（*）。每次我们将一片叶子分成两部分时，如果一些相邻的叶子间隔对具有相同的函数值，则可能违反不变式。幸运的是，每个设置/添加操作最多添加4个新的叶子间隔。同样，对于每个新间隔，很容易在其左侧和右侧立即找到叶子间隔。因此，我们可以判断是否违反了该不变式。如果是，则我们合并相邻间隔，其中具有相同的值。幸运的是，合并两个相邻的间隔不会触发级联更改（因此，我们不需要检查合并是否可能引入了对不变式的其他违反）。总之，这涉及检查 $f$ $f$ $12=O(1)$ 对间隔并可能合并它们。最后，由于合并会改变树的形状，因此，如果这违反了平衡不变式，请执行任何必要的旋转以使树保持平衡（遵循使二进制树保持平衡的标准技术）。总共，这最多会将额外工作添加到设置/添加操作中。 $O(\lg n)$

因此，此最终数据结构支持所有四个操作，每个操作的运行时间为。更精确的估计是每个操作时间，其中计数设置和添加操作的数量。 $O(\lg n)$ $O(\lg \min(n,s))$ $s$

离别的想法

ew，这是一个非常复杂的方案。我希望我没有犯任何错误。在使用此解决方案之前，请仔细检查我的工作。

— DW
source