在Schönhage–Strassen算法中如何选择内环？

我一直在尝试实现Schönhage–Strassen整数乘法算法，但是在递归步骤中遇到了绊脚石。

我有一个位的值，我想计算。我最初以为是选择一个，使，将分成每个具有位，在对模运算时应用SSA的卷积，即每个值具有位容量的环，然后将碎片放回原处。但是，卷积的输出略大于位（即 $x$ $n$ $x^2 \pmod {2^n+1}$ $k$ $4^k \geq 2n$ $x$ $2^k$ $2^{k-1}$ $2^{2^k}+1$ $2^k$ $2n$ $>2^k$ 每个输出值的位数大于环的容量，这是因为每个输出值是多个乘积之和），所以这是行不通的。我必须添加2的额外因素。

填充中的额外2因子破坏了复杂性。这使我的递归步骤太昂贵了。代替了 $F(n) = n \lg n + \sqrt{n} F(2 \sqrt{n}) = \Theta(n \; \lg n \; \lg \lg n)$ 算法用 $F(n) = n \lg n + \sqrt{n} F(4 \sqrt{n}) = \Theta(n \lg^2 n)$ 算法。

我阅读了一些来自维基百科的链接，但它们似乎都掩盖了如何解决此问题的细节。例如，我可以通过工作模避免额外的填充开销的，这不是2的幂......但后来的事情后来才破的时候我只有非功率剩下2个因素，并且在不加倍数量的情况下不能应用Cooley-Tukey。而且，可能不具有模的乘法逆。因此，仍然存在2的强制因素。 $2^{p 2^k} + 1$ $p$ $p$ $2^p+1$

如何在递归步骤中选择要使用的环，而又不增加渐近复杂性？

或者，以伪代码形式：

multiply_in_ring(a, b, n):
  ...
  // vvv                          vvv //
  // vvv HOW DOES THIS PART WORK? vvv //
  // vvv                          vvv //
  let inner_ring = convolution_ring_for_values_of_size(n);
  // ^^^                          ^^^ //
  // ^^^ HOW DOES THIS PART WORK? ^^^ //
  // ^^^                          ^^^ //

  let input_bits_per_piece = ceil(n / inner_ring.order);
  let piecesA = a.splitIntoNPiecesOfSize(inner_ring.order, input_bits_per_piece);
  let piecesB = b.splitIntoNPiecesOfSize(inner_ring.order, input_bits_per_piece);

  let piecesC = inner_ring.negacyclic_convolution(piecesA, piecesB);
  ...

ds.algorithms

— 克雷格·吉德尼
source

请不要在多个站点上发布相同的问题。每个社区都应该诚实地回答，而不会浪费任何时间。我建议您删除两个副本之一。

— DW

@DW完成。在cs一个星期没有给出任何答案之后，我交叉张贴了文章，认为那对于该网站来说太难了。显然要链接回任何答案。

— Craig Gidney

我明白。如果将来出现这种情况，您可以随时标记您的帖子以引起版主注意，并要求将其迁移，我们可以为您将其移至CSTheory。感谢您的理解！

— DW

该算法有一个版本，其形式为以下形式的模数

2^{ν 2^{n}}

$2^{\nu2^n}$ ：A.Schönhage。具有复杂系数的多项式的数值乘法和除法的渐近快速算法。在EUROCAM '82：欧洲计算机代数会议，Lect。Notes Comp。科学 144，3-15。iai.uni-bonn.de/~schoe/publi39.dvi

— MarkusBläser2016年

IIRC您对现在删除的CS问题有部分自我解答。失去这一点似乎很可耻。您可以在这里添加它吗（在问题中，这样就不会将问题标记为已回答）？

— 彼得·泰勒

该答案摘自Markus在评论中链接的论文“渐近快速算法，用于对具有复杂系数的多项式进行数值乘法和除法”。

你想平方 $n$ 位数，模 $2^n + 1$ 。这是您的工作：

找 $p$ 和 $s$ 满足 $n = (p-1) 2^s$ 和 $s \leq p \leq 2s$ 。
挑选件数 $2^m$ 分割 $n$ 位，以及相应的件数参数：

$\begin{aligned} 米 & = ⌊ s / 2 ⌋ + 1个 \\ s_{2} & = ⌈ s / 2 ⌉ + 1个 \\ p_{2} & = ⌈ p / 2 ⌉ + 1个 \end{aligned}$ $\begin{align} m &= \lfloor s/2 \rfloor + 1 \\s_2 &= \lceil s/2 \rceil + 1 \\ p_2 &= \lceil p/2 \rceil + 1 \end{align}$
注意 $s_2$ 和 $p_2$ 继续满足 $s_2 \leq p_2 \leq 2 s_2$ 不变的另请注意 $2^m 2^{s_2} p_2 \geq 2n + m + 1$ 满足，因此输入内容适合携带。
像往常一样，在片段上执行基于FFT的负循环卷积，其余部分执行。

这就是最主要的思想：对数填充因子 $p$ 。现在进行复杂性分析。FFT将 $n m$ 工作要做，我们继续 $2^m$ 大小 $(p_2-1) 2^{s_2}$ ，因此我们现在可以使用递归关系wrt进行极其粗略的数学运算 $s$ ：

\begin{aligned} F (s) & (\leq) (p - 1) 2^{s} m + 2^{m} F (⌈ s / 2 ⌉ + 1) \\ (\leq) 2 s 2^{s} (⌊ s / 2 ⌋ + 1) + 2^{⌊ s / 2 ⌋ + 1} F (⌈ s / 2 ⌉ + 1) \\ (\leq) s^{2} 2^{s} + 2 \cdot 2^{s / 2} F (s / 2 + 1) \\ (\leq) s^{2} 2^{s} + 4 (s / 2)^{2} 2^{s} + 16 (s / 4)^{2} 2^{s} + . . . \\ (\leq) 2^{s} s^{2} \lg (s) \\ (\leq) \frac{n}{\lg n} {(\lg \frac{n}{\lg n})}^{2} \lg \lg \frac{n}{\lg n} \\ (\leq) \frac{n}{\lg n} (\lg^{2} n) \lg \lg n \\ (\leq) n (\lg n) \lg \lg n \end{aligned}

$\begin{align} F(s) &(\leq)\; (p-1)2^sm + 2^m F(\lceil s/2\rceil+1) \\ &(\leq)\; 2s2^s (\lfloor s/2\rfloor+1) + 2^{\lfloor s/2\rfloor+1} F(\lceil s/2\rceil+1) \\ &(\leq)\; s^2 2^s + 2 \cdot 2^{s/2} F(s/2+1) \\ &(\leq)\; s^2 2^s + 4 (s/2)^2 2^s + 16(s/4)^2 2^s + ... \\ &(\leq)\; 2^s s^2 \lg(s) \\ &(\leq)\; \frac{n}{\lg n} \left(\lg \frac{n}{\lg n}\right)^2 \lg \lg \frac{n}{\lg n} \\ &(\leq)\; \frac{n}{\lg n} (\lg^2 n) \lg \lg n \\ &(\leq)\; n \;(\lg n) \lg \lg n \end{align}$

尽管我在这些步骤中作弊很多，但这似乎是对的。

“把戏”似乎是我们最终得到的事实 $s^2$ 代替 $s$ 基本费用。每个递归级别仍然有两个乘以2的乘积，就像我在问题中抱怨的那样，但是现在减半 $s$ 付出了双倍的红利，所以一切顺利。然后，最后，我们取消了 $s$ （实际上是 $\log n$ ）多亏了 $p$ 相对于 $s$ 原来。

— 克雷格·吉德尼
source