为什么Python 3允许“ 00”作为0的文字,却不允许“ 01”作为1的文字?


111

为什么Python 3允许“ 00”作为原义的0,却不允许“ 01”作为原义的1?有充分的理由吗?这种矛盾使我感到困惑。(我们正在谈论的是Python 3,它故意打破了向后兼容性以实现诸如一致性之类的目标。)

例如:

>>> from datetime import time
>>> time(16, 00)
datetime.time(16, 0)
>>> time(16, 01)
  File "<stdin>", line 1
    time(16, 01)
              ^
SyntaxError: invalid token
>>>

42
现在无法将其删除,否则它将破坏与此问题的向后兼容性!
John La Rooy

Answers:


103

根据https://docs.python.org/3/reference/lexical_analysis.html#integer-literals

整数文字由以下词汇定义描述:

integer        ::=  decimalinteger | octinteger | hexinteger | bininteger
decimalinteger ::=  nonzerodigit digit* | "0"+
nonzerodigit   ::=  "1"..."9"
digit          ::=  "0"..."9"
octinteger     ::=  "0" ("o" | "O") octdigit+
hexinteger     ::=  "0" ("x" | "X") hexdigit+
bininteger     ::=  "0" ("b" | "B") bindigit+
octdigit       ::=  "0"..."7"
hexdigit       ::=  digit | "a"..."f" | "A"..."F"
bindigit       ::=  "0" | "1"

除了可以存储在可用内存中的整数之外,整数文字的长度没有限制。

请注意,不允许使用非零十进制数字开头的零。这是为了消除C样式八进制文字的歧义,Python在3.0版之前使用了这些样式。

如此处所述,不允许使用非零十进制数字开头的零"0"+作为一个非常特殊的情况是合法的,这在Python 2中是不存在的

integer        ::=  decimalinteger | octinteger | hexinteger | bininteger
decimalinteger ::=  nonzerodigit digit* | "0"
octinteger     ::=  "0" ("o" | "O") octdigit+ | "0" octdigit+

SVN commit r55866在令牌生成器中实现了PEP 3127,它禁止使用旧0<octal>数字。但是,奇怪的是,它也添加了以下注释:

/* in any case, allow '0' as a literal */

带有nonzeroSyntaxError在以下数字序列包含非零数字时抛出的特殊标志。

这很奇怪,因为PEP 3127不允许这种情况:

该PEP建议,将使用Python 3.0(和2.6的Python 3.0预览模式)从语言中删除使用前导零指定八进制数的功能,并且每当前导“ 0”为紧跟着另一个数字

(强调我的)

因此,允许多个零的事实在技术上违反了PEP,并且基本上由Georg Brandl实施为特殊情况。他进行了相应的文档更改,以注意这"0"+是的有效案例decimalinteger(以前已在中进行了介绍octinteger)。

我们可能永远不会确切知道为什么Georg选择使之"0"+有效-在Python中它可能永远是一个奇怪的情况。


更新 [2015年7月28日]:这个问题引发了关于python-ideas 的热烈讨论Georg在其中进行了讨论

史蒂文·达普拉诺(Steven D'Aprano)写道:

为什么这样定义?[...]为什么我们写0000以得到零?

我可以告诉你,但后来我不得不杀了你。

格奥尔格

后来,该线程生成了此错误报告,旨在摆脱这种特殊情况。乔治在这里

我不记得有意进行更改的原因(从文档更改中可以看出)。

我现在无法提出更改的充分理由[...]

因此,我们有了它:这种不一致背后的确切原因已不复存在。

最后,请注意,该错误报告已被拒绝:对于Python 3.x的其余部分,前导零将仅在零整数上继续被接受。


6
为什么说“我们可能永远不会确切知道乔治为什么选择...”?如果认识他的人看到了这个话题并通知了他,那么他可能会给出答案!(除非您知道他永远不会再讨论他过去的Python工作或类似情况)
海象

1
我不明白为什么他们不只是提出第二个Python 2 octinteger案例"0" octdigit*0是C / C ++中的八进制文字。
Random832

1
实际上,英语在这方面有点含糊。“另一个”一词可以表示“一个”,也可以表示“另一个”。对PEP 3127中的粗体引号进行的一种有效的英语解释是,意味着“只要在开头的“ 0”后面紧跟一个非“ 0”的数字,就会引发SyntaxError”(我不确定这是否是实际的意图(尽管该解释似乎得到了实际代码的支持),但无论如何我认为在没有进一步说明该句子的情况下,从技术上违反PEP并不准确。
GrandOpener

2
@GrandOpener:请注意,这001是非法的,而您的解释将使之合法(因为“立即”的含义应该非常明确)。
nneonneo

好点子。因此,肯定违反了PEP。模棱两可的是违反它的确切性质。:)
GrandOpener

17

这是特例("0"+

2.4.4。整数文字

整数文字由以下词汇定义描述:

整数:: =十进制整数| 八进制| hexinteger | 二进制整数
十进制整数:: =非零数字* “ 0” +
非零数字:: =“ 1” ...“ 9”
数字:: =“ 0” ...“ 9”
八位整数:: =“ 0”(“ o” |“ O”)八位数字+
hexinteger :: =“ 0”(“ x” |“ X”)十六进制+
bininteger :: =“ 0”(“ b” |“ B”)bindigit +
八位数字:: =“ 0” ...“ 7”
十六进制::: digit | “ a” ...“ f” | “ A” ...“ F”
bindigit :: =“ 0” | “ 1”

如果您查看语法,则很容易看到0需要特殊情况。我不确定为什么在+那里需要' '。是时候浏览一下开发邮件列表了...


有趣的是,在Python2中,有多个0解析为octinteger(最终结果仍然0是)

十进制整数:: =非零数字* “ 0”
八位整数:: =“ 0”(“ o” |“ O”)八位数字+ | “ 0”八位数字+

1
和任何想法,为什么还有"0"+"0"
lejlot

1
@lejlot,还没有-但是我很感兴趣。不过,它绝对是规格的一部分
John La Rooy

3

Python2使用前导零指定八进制数:

>>> 010
8

为了避免这种情况(?误导性)行为,Python3需要明确的前缀0b0o0x

>>> 0o10
8

15
问题仍然存在:为什么被00允许?(而且0000000等)
迈克尔·基尔

4
@MichaelGeary:可能是因为它不能模棱两可(00000000是0,而不管其基数如何),将其删除会不必要地破坏代码?还是很奇怪。
RemcoGerlich 2015年

5
@RemcoGerlich如果我没记错的话,01也是1不管基础。
Holt 2015年

2
@Holt:但是允许“ 0” +“ 1”吗?作为一种特殊情况,可能会更加令人困惑。
RemcoGerlich

4
@RemcoGerlich从来没有说过;)我只是说那can't be ambiguous不是争论,因为01也不能模棱两可。IMO,00此案只是一个特例,因为它0不应该这样。
Holt 2015年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.