传播输入的功能

我想知道从n位数字到n位数字的函数 $f$ 是否具有以下特征：

$f$ 应该是双射的
无论 $f$ 和 $f^{-1}$ 应该是可计算的相当快
$f$ 应该返回与其输入没有显着相关性的数字。

原因是：

我想编写一个对数据进行操作的程序。数据的某些信息存储在二进制搜索树中，其中搜索关键字是字母的符号。随着时间的流逝，我在字母表中添加了更多符号。新符号只是获得下一个可用的免费号码。因此，树将始终对较小的键具有较小的偏差，这将导致比我认为需要的更多的重新平衡。

我的想法是与到裂伤符号数 $f$ 使得它们的整个范围内的广泛普及 $[0,2^{64}-1]$ 。由于符号号仅在输入和输出期间才有关系，而符号输入只发生一次，因此应用此功能应该不会太昂贵。

我曾考虑过Xorshift随机数生成器的一次迭代，但是尽管从理论上讲应该是可行的，但我真的不知道一种撤消它的方法。

有人知道这样的功能吗？
这是一个好主意吗？

binary-trees hash binary-arithmetic

— FUZxxl
source

我不是专家，但也许您可以使用伪随机置换（例如，参见Feistel密码）

— 2012年

如果本质上是在计算哈希函数，为什么不使用哈希呢？

— vonbrand

@vonbrand哈希不可逆。请参阅要求编号

— 2。– FUZxxl

为什么它必须是可逆的？通过查找使其可逆有什么问题？

— vonbrand

您可以将（f（x），x）存储为键。

— adrianN 2013年

Answers:

您可以使用Fibonacci哈希，即

。 $\qquad h_F(k) = k \cdot \frac{\sqrt{5} - 1}{2} - \left\lfloor k \cdot \frac{\sqrt{5} - 1}{2} \right\rfloor$

对于你成对-个不同的数字（约）均匀地散布在。通过缩放到并四舍五入（向下），您可以在该间隔中获得均匀分布的数字。 $k=1,\dots,n$ $n$ $[0,1]$ $[1..M]$

例如，这些是缩放为（左原始序列，右排序）： $h_F(1), \dots, h_F(200)$ $[0..10000]$

enter image description here

这是Knuth称为乘法哈希的一个实例。对于电脑字的大小，有些整数相对素和所需地址的数量，我们使用 $w$ $A$ $w$ $M$

$\qquad h(k) = \left\lfloor M \left( \bigl( k \cdot \frac{A}{w}\bigr) \mod 1 \right) \right\rfloor$

作为哈希函数。上面是（确保您可以以足够的精度进行计算）。尽管这也适用于除以外的任何其他无理数，但它是仅两个导致“分布最均匀”的数之一。 $A/w = \phi^{-1} = \frac{\sqrt{5}-1}{2}$ $\phi^{-1}$

在Donald Knuth撰写的《计算机编程艺术》第3卷中找到更多信息（第二版第513页的6.4章）。特别是，你会发现，为什么得到的数字是两两不同的（至少如果），以及如何计算反函数，如果你使用自然和代替。 $n \ll M$ $A$ $w$ $\phi^{-1}$

— 拉斐尔
source

如何有效地计算

？

f^{- 1}

$f^{-1}$

— frafl 2013年

@frafl希望我的编辑能够解决您的问题。但是很明显，这些哈希技术也没有经过特别设计以有效地反转。

— 拉斐尔

是的，我会赞成，但是我不建议您将其作为接受的答案。

— frafl 2013年

对于位输入，此功能有效： $k$

$\mathrm{hash}(n) = (n \bmod 2^{\lceil\frac{k}{2}\rceil})\cdot 2^{\lceil\frac{k}{2}\rceil} + n \,\mathrm{div}\, 2^{\lceil\frac{k}{2}\rceil}$

这是可逆的，因为，并且具有非序列对，其中。要注意的是输出和输入可以关联，特别是如果你输入是在 $\mathrm{hash}(\mathrm{hash}(n)) = n$ $\{n,m\}, n < m$ $\mathrm{hash}(m) < \mathrm{hash}(n)$ 。 $\{1,\dots,2^{\lceil\frac{k}{2}\rceil}-1\}$

参考：可逆哈希函数

— 雷扎
source

这看起来很简单。我要测试那个。

— 2013年

1.取决于输入，它可能会产生很强的相关性（Spearman的

最高为

）2.这是32位的，而不是64位的。3.您能以语言无关的方式编写它吗？

1

$1$

ρ

$\rho$

— frafl 2013年

很清楚！对于64位（0x00000000FFFFFFFFFF），则应将（<<）移位32位。此功能简单，实用且在实践中足够快。

— Reza

但是，你为什么不使用位的排列，若不能映射

到

？如上所述，这显然违反了OP要求的相关条件。

x \in {1, \dots, 2^{32} - 1}

$x \in \{1,\dots,2^{32}-1\}$

2^{32} x

$2^{32}x$

— frafl 2013年