2套并集不包含所有项目


94

在下面的联合中更改两个集合的顺序时,为什么会得到不同的结果?

set1 = {1, 2, 3}
set2 = {True, False}

print(set1 | set2)
# {False, 1, 2, 3}

print(set2 | set1)
#{False, True, 2, 3}

Answers:


110

为什么union()不包含所有项目

1True是等价的,被认为是重复的。同样,0False也等效:

>>> 1 == True
True
>>> 0 == False
True

使用哪个等效值

当遇到多个等效值时,集合将保持第一个可见:

>>> {0, False}
{0}
>>> {False, 0}
{False}

使价值观与众不同的方法

为了使它们与众不同,只需将它们(value, type)成对存储:

>>> set1 = {(1, int), (2, int), (3, int)}
>>> set2 = {(True, bool), (False, bool)}
>>> set1 | set2
{(3, <class 'int'>), (1, <class 'int'>), (2, <class 'int'>),
 (True, <class 'bool'>), (False, <class 'bool'>)}
>>> set1 & set2
set()

区分值的另一种方法是将它们存储为字符串:

>>> set1 = {'1', '2', '3'}
>>> set2 = {'True', 'False'}
>>> set1 | set2
{'2', '3', 'False', 'True', '1'}
>>> set1 & set2
set()

希望这可以消除谜团并显示前进的方向:-)


从评论中救出:

这是为破坏十字型等价(即标准技术0.0 == 0True == 1以及Decimal(8.5) == 8.5)该技术是在Python 2.7的正则表达式模块用于力的unicode正则表达式被从其他等效的STR正则表达式清楚地高速缓存。是在Python也使用的技术类型参数为true时,对于functools.lru_cache()为3。

如果OP需要除默认等效关系以外的其他内容,则需要定义一些新关系。根据使用情况,可能是字符串不区分大小写,Unicode规范化,视觉外观(看起来不同的事物被认为是不同的),身份(没有两个不同的对象被认为是相等的),值/类型对或其他一些定义等价关系的函数。给定OP的特定示例,他/她似乎期望按类型区分或视觉区分。


20

在Python,False0被认为是等效的,True1。因为True1被视为相同的值,所以它们中的一个只能同时出现在集合中。哪一个取决于它们添加到集合中的顺序。在第一行中,set1将其用作第一集合,因此我们可以得到1结果集合。在第二组中,True在第一组中,因此True包含在结果中。



4

为布尔定义了比较运算符(==!=),TrueFalse匹配1和0。

这就是为什么在集合联合中,当它检查是否True已经在新集合中时,会得到一个真实的答案:

>>> True in {1}
True
>>> 1 in {True}
True
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.