检查数组是否是另一个数组的子集


145

关于如何检查该列表是否是另一个列表的子集有任何想法吗?

具体来说,我有

List<double> t1 = new List<double> { 1, 3, 5 };
List<double> t2 = new List<double> { 1, 5 };

如何使用LINQ检查t2是t1的子集?


如果列表已排序(如您的示例所示),则应该可以在O(n + m)时间内完成。
Panic Panic'1

Answers:


255
bool isSubset = !t2.Except(t1).Any();


@Bul Ikana这段代码的工作很简单,如果没有为工作提供IEqualityComparer,扩展方法会在内部调用被覆盖的对象类方法的Equals和GetHashCode。
Mrinal Kamboj

2
如果列表的长度为n和m,此算法的时间复杂度是多少?
Panic Panic'1

2
如果将其归结为一个名为ContainsAll的linq方法,那就太好了
Sebastian Patten,

60

如果使用集合,请使用HashSet而不是List。然后,您可以简单地使用IsSubsetOf()

HashSet<double> t1 = new HashSet<double>{1,3,5};
HashSet<double> t2 = new HashSet<double>{1,5};

bool isSubset = t2.IsSubsetOf(t1);

抱歉,它不使用LINQ。:-(

如果您需要使用列表,那么@Jared的解决方案可以满足您的警告,您需要删除所有重复的元素。


3
究竟。您需要设置操作,请使用为它们设计的类。Cameron的解决方案具有创造力,但不如HashSet清晰/富于表现力。
technophile

2
嗯,我不同意,因为该问题专门说“使用LINQ”。
JaredPar

9
@JaredPar:那又如何?向某人展示正确的方式是否比他们想要的方式更好?
乔纳森·艾伦

列表会保持其顺序,而集合则不会。如果顺序很重要,这将导致错误的结果。
UuDdLrLrSs

11

如果您要进行单元测试,则还可以使用CollectionAssert.IsSubsetOf方法:

CollectionAssert.IsSubsetOf(subset, superset);

在上述情况下,这意味着:

CollectionAssert.IsSubsetOf(t2, t1);

7

这是比此处发布的其他解决方案(尤其是顶级解决方案)有效得多的解决方案:

bool isSubset = t2.All(elem => t1.Contains(elem));

如果您在t2中找到一个不在t1中的元素,那么您知道t2不是t1的子集。与使用.Except或.Intersect的解决方案不同,此方法的优点是可以在原位完成所有操作,而无需分配额外的空间。此外,此解决方案能够在找到违反子集条件的单个元素后立即中断,而其他解决方案则继续搜索。下面是该解决方案的最佳长形式,在我的测试中仅比上述速记解决方案略快。

bool isSubset = true;
foreach (var element in t2) {
    if (!t1.Contains(element)) {
        isSubset = false;
        break;
    }
}

我对所有解决方案进行了基本的性能分析,结果非常出色。这两个解决方案比.Except()和.Intersect()解决方案快大约100倍,并且不使用任何额外的内存。


那正是!t2.Except(t1).Any()在做什么。Linq正在来回工作。Any()正在询问IEnumerable是否至少有一个元素。在这种情况下t2.Except(t1),仅发射第一个元素t2不在中的元素t1。如果的第一个元素t2不在其中,t1则完成最快,如果的所有元素t2t1其中运行时间最长。
2014年

在进行某种基准测试时,我发现,当您采用t1={1,2,3,...9999}和时t2={9999,9998,99997...9000},您会得到以下测量结果:!t2.Except(t1).Any(): 1ms -> t2.All(e => t1.Contains(e)): 702ms。范围越大,情况就越糟。
2014年

2
这不是Linq的工作方式。t2.Except (t1)返回IEnumerable而不是Collection。它只有在你完全遍历它,例如通过发出所有可能的项目ToArray ()ToList ()或使用foreach不破坏里面。搜索linq延迟执行以阅读有关该概念的更多信息。
2014年

1
我完全了解延迟执行在Linq中的工作方式。您可以推迟执行所有所需的执行,但是如果要确定t2是否是t1的子集,则需要对整个列表进行迭代以弄清楚。没有回避这个事实。
user2325458

2
让我们从您的评论的示例t2={1,2,3,4,5,6,7,8} t1={2,4,6,8} t2.Except(t1)T2 =的=>第一元件1的=>差1至t1为1(核对{2,4,6,8})=> Except()发射第一元件1 => Any()得到的元素=> Any()结果为true =>无需进一步检查t2中的元素。
2014年

6

@Cameron的解决方案作为扩展方法:

public static bool IsSubsetOf<T>(this IEnumerable<T> a, IEnumerable<T> b)
{
    return !a.Except(b).Any();
}

用法:

bool isSubset = t2.IsSubsetOf(t1);

(这与@Michael的博客上发布的内容相似,但并不完全相同)


0

在@Cameron和@Neil的答案的基础上,我编写了一个扩展方法,该方法使用与Enumerable类相同的术语。

/// <summary>
/// Determines whether a sequence contains the specified elements by using the default equality comparer.
/// </summary>
/// <typeparam name="TSource">The type of the elements of source.</typeparam>
/// <param name="source">A sequence in which to locate the values.</param>
/// <param name="values">The values to locate in the sequence.</param>
/// <returns>true if the source sequence contains elements that have the specified values; otherwise, false.</returns>
public static bool ContainsAll<TSource>(this IEnumerable<TSource> source, IEnumerable<TSource> values)
{
    return !values.Except(source).Any();
}

0

在这里,我们检查子列表中是否存在t2父列表未包含的元素t1。如果不存在,则列表是另一个列表的子集

例如:

bool isSubset = !(t2.Any(x => !t1.Contains(x)));

-1

试试这个

static bool IsSubSet<A>(A[] set, A[] toCheck) {
  return set.Length == (toCheck.Intersect(set)).Count();
}

这里的想法是,相交只会返回两个数组中的值。此时,如果结果集的长度与原始集的长度相同,则“集合”中的所有元素也都在“检查”中,因此“集合”是“ toCheck”的子集

注意:如果“设置”重复,则我的解决方案不起作用。我不会更改它,因为我不想偷别人的票。

提示:我投票赞成卡梅伦的回答。


4
如果它们确实是集合,则此方法有效,但如果第二个“集合”包含重复元素,则该方法确实有效,因为它实际上是一个列表。您可能要使用HashSet <double>来确保它具有设置的语义。
tvanfosson

当两个数组都具有另一个数组中没有的元素时,则不起作用。
da_berni 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.