C99预处理器Turing是否已完成？

Question 1

在发现Boost预处理器的功能之后，我发现自己想知道：C99预处理器Turing是否完整？

如果没有，那么缺少资格的原因是什么？

Question 2

这是滥用预处理器来实现图灵机的示例。请注意，需要一个外部构建脚本来将预处理器的输出反馈回其输入，因此预处理器本身并不完整。不过，这是一个有趣的项目。

从先前链接的项目的描述中：

预处理程序尚未完成图灵处理，至少在程序仅被处理过一次的情况下至少不会完成。即使允许程序包含自身，也是如此。（原因是对于给定的程序，预处理器只有有限数量的状态，加上一个堆栈，其中包括文件所在的位置。这只是下推式自动机。）

Paul Fultz II的答案令人印象深刻，而且肯定比我以为预处理器所能达到的范围更近，但这不是真正的图灵机。C预处理器有一定的限制，即使您有无限的内存和时间，它也无法像Turing机器一样执行任意程序。C规范的5.2.4.1节为C编译器提供了以下最低限制：

完整表达式中带括号的表达式的63个嵌套级别

内部标识符或宏名称中的63个有效初始字符

在一个预处理翻译单元中同时定义4095个宏标识符

逻辑源代码行中的4095个字符

下面的计数器机制要求每个值都有一个宏定义，因此宏定义限制将限制您可以循环多少次（EVAL(REPEAT(4100, M, ~))将产生未定义的行为）。这从本质上限制了您可以执行的程序的复杂性。多级扩展的嵌套和复杂性也可能会达到其他限制之一。

这与“无限内存”限制根本不同。在这种情况下，规范特别指出，即使具有无限的时间，内存等，也只需要符合标准的C编译器即可满足这些限制。任何超出这些限制的输入文件都可以以不可预测或不确定的方式处理（或直接拒绝）。某些实现可能有更高的限制，或者根本没有限制，但这被认为是“特定于实现的”，而不是标准的一部分。可能可以使用Paul Fultz II的方法在计算机上实现图灵机某些特定的编译器实现没有任何限制，但是从一般意义上说“可以在任何任意的，符合标准的C99预处理器上完成”，答案是否定的。由于这里的限制是语言本身所固有的，而不仅仅是我们无法构建无限计算机的副作用，所以我说这破坏了图灵的完整性。

Question 3

宏不会直接递归扩展，但是有一些方法可以解决此问题。

在预处理器中进行递归的最简单方法是使用延迟表达式。延迟表达式是需要更多扫描才能完全扩展的表达式：

#define EMPTY()
#define DEFER(id) id EMPTY()
#define OBSTRUCT(...) __VA_ARGS__ DEFER(EMPTY)()
#define EXPAND(...) __VA_ARGS__

#define A() 123
A() // Expands to 123
DEFER(A)() // Expands to A () because it requires one more scan to fully expand
EXPAND(DEFER(A)()) // Expands to 123, because the EXPAND macro forces another scan

为什么这很重要？当宏被扫描并扩展时，它会创建一个禁用上下文。此禁用上下文将导致一个标记，该标记表示当前正在扩展的宏，显示为蓝色。因此，一旦将其涂成蓝色，宏将不再扩展。这就是为什么宏不递归扩展的原因。但是，禁用上下文仅在一次扫描期间存在，因此通过延迟扩展，我们可以防止宏变成蓝色。我们只需要对表达式进行更多扫描即可。我们可以用这个EVAL宏：

#define EVAL(...)  EVAL1(EVAL1(EVAL1(__VA_ARGS__)))
#define EVAL1(...) EVAL2(EVAL2(EVAL2(__VA_ARGS__)))
#define EVAL2(...) EVAL3(EVAL3(EVAL3(__VA_ARGS__)))
#define EVAL3(...) EVAL4(EVAL4(EVAL4(__VA_ARGS__)))
#define EVAL4(...) EVAL5(EVAL5(EVAL5(__VA_ARGS__)))
#define EVAL5(...) __VA_ARGS__

现在，如果我们要实施 REPEAT使用递归宏，则首先需要一些递增和递减运算符来处理状态：

#define CAT(a, ...) PRIMITIVE_CAT(a, __VA_ARGS__)
#define PRIMITIVE_CAT(a, ...) a ## __VA_ARGS__

#define INC(x) PRIMITIVE_CAT(INC_, x)
#define INC_0 1
#define INC_1 2
#define INC_2 3
#define INC_3 4
#define INC_4 5
#define INC_5 6
#define INC_6 7
#define INC_7 8
#define INC_8 9
#define INC_9 9

#define DEC(x) PRIMITIVE_CAT(DEC_, x)
#define DEC_0 0
#define DEC_1 0
#define DEC_2 1
#define DEC_3 2
#define DEC_4 3
#define DEC_5 4
#define DEC_6 5
#define DEC_7 6
#define DEC_8 7
#define DEC_9 8

接下来，我们需要更多的宏来执行逻辑：

#define CHECK_N(x, n, ...) n
#define CHECK(...) CHECK_N(__VA_ARGS__, 0,)

#define NOT(x) CHECK(PRIMITIVE_CAT(NOT_, x))
#define NOT_0 ~, 1,

#define COMPL(b) PRIMITIVE_CAT(COMPL_, b)
#define COMPL_0 1
#define COMPL_1 0

#define BOOL(x) COMPL(NOT(x))

#define IIF(c) PRIMITIVE_CAT(IIF_, c)
#define IIF_0(t, ...) __VA_ARGS__
#define IIF_1(t, ...) t

#define IF(c) IIF(BOOL(c))

#define EAT(...)
#define EXPAND(...) __VA_ARGS__
#define WHEN(c) IF(c)(EXPAND, EAT)

现在，使用所有这些宏，我们可以编写一个递归REPEAT宏。我们使用REPEAT_INDIRECT宏来递归地引用自身。这可以防止宏被涂成蓝色，因为它将在不同的扫描（和使用不同的禁用上下文）下扩展。我们OBSTRUCT在这里使用，这将延迟两次扩展。这是必要的，因为条件WHEN应用一次扫描。

#define REPEAT(count, macro, ...) \
    WHEN(count) \
    ( \
        OBSTRUCT(REPEAT_INDIRECT) () \
        ( \
            DEC(count), macro, __VA_ARGS__ \
        ) \
        OBSTRUCT(macro) \
        ( \
            DEC(count), __VA_ARGS__ \
        ) \
    )
#define REPEAT_INDIRECT() REPEAT

//An example of using this macro
#define M(i, _) i
EVAL(REPEAT(8, M, ~)) // 0 1 2 3 4 5 6 7

现在，由于计数器的限制，此示例仅限于10次重复。就像计算机中的重复计数器会受到有限内存的限制。就像在计算机中一样，可以将多个重复计数器组合在一起以解决此限制。此外，我们可以定义一个FOREVER宏：

#define FOREVER() \
    ? \
    DEFER(FOREVER_INDIRECT) () ()
#define FOREVER_INDIRECT() FOREVER
// Outputs question marks forever
EVAL(FOREVER())

这将尝试?永远输出，但最终将停止，因为不再应用任何扫描。现在的问题是，如果我们对其进行无限次扫描，该算法是否会完成？这被称为暂停问题，图灵完整性是证明暂停问题的不确定性所必需的。正如您所看到的，预处理器可以充当图灵完整的语言，但是它不仅限于计算机的有限内存，还受到应用的有限扫描次数的限制。

Question 4

为了使Turing完整，需要定义可能永远不会完成的递归-将其称为mu-递归运算符。

要定义这样一个运算符，需要一个无限的已定义标识符空间（如果对每个标识符进行有限次数的评估），因为无法知道先验找到结果的时间上限。在代码内部包含有限数量的运算符的情况下，人们需要能够检查无限数量的可能性。

因此，此类函数无法由C预处理程序计算因为在C预处理程序中，定义的宏数量有限，并且每个宏仅扩展一次。

C预处理程序使用Dave Prosser的算法（由Dave Prosser在1984年为WG14团队编写）。在这种算法中，宏在第一次扩展时就被涂成蓝色。递归调用（或相互递归调用）不会扩展它，因为在第一次扩展开始时它已经被涂成蓝色。因此，使用有限数量的预处理行，就不可能对函数（宏）进行无限调用，这是mu递归运算符的特征。

C预处理器只能计算sigma递归运算符。

有关详细信息，请参阅Marvin L. Minsky（1967）的计算过程-计算：有限和无限机器，Prentice-Hall公司，Englewood Cliffs，NJ等。

Question 5

Turing在限制内完成（所有计算机也一样，因为它们没有无限的RAM）。检查一下您可以使用Boost Preprocessor进行的操作。

根据问题编辑进行编辑：

Boost的主要限制是特定于编译器的最大宏扩展深度。同样，实现递归的宏（FOR ...，ENUM ...等）并不是真正的递归，由于有一系列几乎相同的宏，它们才以这种方式出现。从总体上看，此限制与实际递归语言中的最大堆栈大小没有什么不同。

对于有限的图灵完备性（Turing-compatibility？）而言，唯一真正需要的两件事是迭代/递归（等效构造）和条件分支。