Linq to Entities加入vs组加入


181

我已经在网上搜索过,但仍然找不到简单的答案。有人可以用简单的英语解释什么是a GroupJoin吗?它与常规内部结构Join有何不同?常用吗?它仅用于方法语法吗?那么查询语法呢?一个C#代码示例会很好。


根据MSDN,组联接是带有in表达式的联接子句。 join子句包含更多信息和代码示例。本质上是内部联接(如果右侧没有元素与左侧任何元素匹配,则结果为空);但是结果被分组。
2013年

Answers:


371

行为

假设您有两个列表:

Id  Value
1   A
2   B
3   C

Id  ChildValue
1   a1
1   a2
1   a3
2   b1
2   b2

当您Join在该Id字段上的两个列表时,结果将是:

Value ChildValue
A     a1
A     a2
A     a3
B     b1
B     b2

当您GroupJoin在该Id字段上的两个列表时,结果将是:

Value  ChildValues
A      [a1, a2, a3]
B      [b1, b2]
C      []

因此Join产生父值和子值的平坦(表格)结果。
GroupJoin在第一个列表中产生一个条目列表,每个条目在第二个列表中都有一组联接的条目。

这就是在SQL中Join与之等效的原因INNER JOIN:没有的条目C。While 与结果集中GroupJoinOUTER JOIN:等效C,但是相关条目的列表为空(在SQL结果集中将存在一行C - null)。

句法

因此,让两个列表分别为IEnumerable<Parent>IEnumerable<Child>。(如果是对实体的Linq :)IQueryable<T>

Join 语法将是

from p in Parent
join c in Child on p.Id equals c.Id
select new { p.Value, c.ChildValue }

返回IEnumerable<X>X是具有两个属性Value和的匿名类型ChildValue。此查询语法使用幕后Join方法。

GroupJoin 语法将是

from p in Parent
join c in Child on p.Id equals c.Id into g
select new { Parent = p, Children = g }

返回IEnumerable<Y>where Y是一个匿名类型,该匿名类型由type的一个属性和type的Parent一个属性组成IEnumerable<Child>。此查询语法使用幕后GroupJoin方法。

我们可以select g在后面的查询中进行选择,即选择一个IEnumerable<IEnumerable<Child>>,例如一个列表列表。在许多情况下,包含父项的选择更为有用。

一些用例

1.产生平坦的外部连接。

如前所述,该声明...

from p in Parent
join c in Child on p.Id equals c.Id into g
select new { Parent = p, Children = g }

...产生一个有孩子群体的父母名单。可以通过两个小的添加将其变成平面的父子对列表:

from p in parents
join c in children on p.Id equals c.Id into g // <= into
from c in g.DefaultIfEmpty()               // <= flattens the groups
select new { Parent = p.Value, Child = c?.ChildValue }

结果类似于

Value Child
A     a1
A     a2
A     a3
B     b1
B     b2
C     (null)

请注意,上面的语句中重新使用了范围变量 c。这样做,join只要将outer join等价物添加into g from c in g.DefaultIfEmpty()到现有join语句中,就可以简单地将其转换为。

这是查询(或综合)语法的亮点。方法(或流利的)语法显示了实际发生的情况,但是很难编写:

parents.GroupJoin(children, p => p.Id, c => c.Id, (p, c) => new { p, c })
       .SelectMany(x => x.c.DefaultIfEmpty(), (x,c) => new { x.p.Value, c?.ChildValue } )

因此outer joinLINQ中的单位是GroupJoin,由展平SelectMany

2.保存顺序

假设父母的名单更长一些。某些UI会Id以固定顺序将所选父母的列表作为值生成。让我们使用:

var ids = new[] { 3,7,2,4 };

现在,必须按照此精确顺序从父母列表中过滤出选定的父母。

如果我们做...

var result = parents.Where(p => ids.Contains(p.Id));

...的顺序parents将决定结果。如果按排序Id,则结果将是父母2、3、4、7。不好。但是,我们也可以使用join过滤列表。并通过使用ids第一个列表,将保留顺序:

from id in ids
join p in parents on id equals p.Id
select p

结果是父母3、7、2、4。


那么在GroupJoin中,子值将包含对象,该对象包含相关值吗?
duyn9uyen

就像您说的那样,GroupJoin就像一个外部联接,但是该语法(对于组联接来说完全是linq)说,它不像外部联接,而是左外部联接。
Imad

2
我想我会指定“平面外连接”是左外连接。
NetMage

1
我现在明白了,完美地解释
一下-peterincumbria

19

根据eduLINQ

掌握GroupJoin所做的事情的最佳方法是考虑Join。在那里,总体思路是我们浏览“外部”输入序列,从“内部”序列中找到所有匹配项(基于每个序列上的键投影),然后生成成对的匹配元素。GroupJoin与之类似,只是它不是产生元素对,而是基于该项目和匹配的“内部”项目的序列为每个“外部”项目产生单个结果

唯一的区别在于return语句:

加盟

var lookup = inner.ToLookup(innerKeySelector, comparer); 
foreach (var outerElement in outer) 
{ 
    var key = outerKeySelector(outerElement); 
    foreach (var innerElement in lookup[key]) 
    { 
        yield return resultSelector(outerElement, innerElement); 
    } 
} 

群组加入

var lookup = inner.ToLookup(innerKeySelector, comparer); 
foreach (var outerElement in outer) 
{ 
    var key = outerKeySelector(outerElement); 
    yield return resultSelector(outerElement, lookup[key]); 
} 

在这里阅读更多:

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.