按多列分组


967

如何在LINQ中对多个列进行分组

在SQL中与此类似:

SELECT * FROM <TableName> GROUP BY <Column1>,<Column2>

如何将其转换为LINQ:

QuantityBreakdown
(
    MaterialID int,
    ProductID int,
    Quantity float
)

INSERT INTO @QuantityBreakdown (MaterialID, ProductID, Quantity)
SELECT MaterialID, ProductID, SUM(Quantity)
FROM @Transactions
GROUP BY MaterialID, ProductID

Answers:


1212

使用匿名类型。

例如

group x by new { x.Column1, x.Column2 }

29
如果您不熟悉使用匿名类型进行分组,则在此示例中使用'new'关键字可以解决问题。
克里斯(Chris)

8
在带有nHibernate的mvc的情况下,由于dll问题而出现错误。通过GroupBy(x => new {x.Column1,x.Column2},(key,group)=> new {Key1 = key.Column1,Key2 = key.Column2,Result = group.ToList()})解决的问题;
米兰

我认为在这种情况下,新对象将通过引用进行比较,因此没有匹配项-没有分组。
HoGo

4
@HoGo匿名类型的对象实现了自己的Equals和GetHashCode方法,这些方法在对对象进行分组时使用。
拜伦·卡拉斯科

当您不熟悉Linq时,很难可视化输出数据结构。这是否会创建将匿名类型用作键的分组?
雅克

760

程序样本

.GroupBy(x => new { x.Column1, x.Column2 })

返回的对象是什么类型?
mggSoft

5
@MGG_Soft,这将是一个匿名类型
Alex

该代码对我不起作用:“无效的匿名类型声明符”。
thalesfc 2014年

19
@Tom应该可以这样工作。当您跳过命名匿名类型的字段时,C#假定您要使用投影中最终访问的属性/字段的名称。(因此,您的示例等同于Mo0gles')
Chris Pfohl

1
找到了我的答案。我需要定义一个包含Column1和Column2属性的新实体(MyViewEntity),返回类型为:IEnumerable <IGrouping <MyViewEntity,MyEntity >>,分组代码片段为:MyEntityList.GroupBy(myEntity => new MyViewEntity {Column1 = myEntity。 Column1,Column2 = myEntity.Column2});
阿米尔·查特巴赫

467

确定为:

var query = (from t in Transactions
             group t by new {t.MaterialID, t.ProductID}
             into grp
                    select new
                    {
                        grp.Key.MaterialID,
                        grp.Key.ProductID,
                        Quantity = grp.Sum(t => t.Quantity)
                    }).ToList();

75
+1-感谢您提供的综合示例。另一个答案的代码段太短,没有上下文。您还将显示一个聚合函数(在这种情况下为Sum)。非常有帮助。我发现将聚合函数(即MAX,MIN,SUM等)与分组并排使用是一种常见的情况。
barrypicker

此处:stackoverflow.com/questions/14189537/…,当分组基于已知其名称的单个列时显示,用于数据表,但是如果要基于分组的列如何进行必须动态生成?
bg

这对于理解分组的概念以及对其应用聚合非常有帮助。
rajibdotnet

1
很好的例子...正是我想要的。我什至需要汇总,因此即使我正在寻找可以从中得到足够满足我需要的lambda,这也是一个完美的答案。
凯夫波

153

对于“按多列分组”,请改用此方法...

GroupBy(x=> new { x.Column1, x.Column2 }, (key, group) => new 
{ 
  Key1 = key.Column1,
  Key2 = key.Column2,
  Result = group.ToList() 
});

用同样的方法可以添加Column3,Column4等。


4
这非常有帮助,应该会得到更多的支持!Result包含链接到所有列的所有数据集。非常感谢!
j00hi 2013年

1
注意:我必须使用.AsEnumerable()而不是ToList()
GMan 2013年

1
太好了,谢谢你。这是我的例子。请注意,GetFees返回一个IQueryable <Fee> RegistryAccountDA.GetFees(registryAccountId,fromDate,toDate).GroupBy(x => new {x.AccountId,x.FeeName},(key,group)=> new {AccountId = key.AccountId ,FeeName = key.FeeName,AppliedFee = group.Sum(x => x.AppliedFee)?? 0M})。ToList();
克雷格·B

是否可以从此查询中获取未分组的其他列?如果有对象数组,我想将此对象按两列分组,但要从该对象获取所有属性,而不仅仅是这两列。
FrenkyB


19

C#7.1或更大的使用TuplesInferred tuple element names(目前它只能linq to objects当需要表达式树例如,它不支持someIQueryable.GroupBy(...)Github的问题):

// declarative query syntax
var result = 
    from x in inMemoryTable
    group x by (x.Column1, x.Column2) into g
    select (g.Key.Column1, g.Key.Column2, QuantitySum: g.Sum(x => x.Quantity));

// or method syntax
var result2 = inMemoryTable.GroupBy(x => (x.Column1, x.Column2))
    .Select(g => (g.Key.Column1, g.Key.Column2, QuantitySum: g.Sum(x => x.Quantity)));

C#3或更高版本,可使用anonymous types

// declarative query syntax
var result3 = 
    from x in table
    group x by new { x.Column1, x.Column2 } into g
    select new { g.Key.Column1, g.Key.Column2, QuantitySum = g.Sum(x => x.Quantity) };

// or method syntax
var result4 = table.GroupBy(x => new { x.Column1, x.Column2 })
    .Select(g => 
      new { g.Key.Column1, g.Key.Column2 , QuantitySum= g.Sum(x => x.Quantity) });

18

您也可以将Tuple <>用于强类型分组。

from grouping in list.GroupBy(x => new Tuple<string,string,string>(x.Person.LastName,x.Person.FirstName,x.Person.MiddleName))
select new SummaryItem
{
    LastName = grouping.Key.Item1,
    FirstName = grouping.Key.Item2,
    MiddleName = grouping.Key.Item3,
    DayCount = grouping.Count(), 
    AmountBilled = grouping.Sum(x => x.Rate),
}

4
注意:Linq To Entities不支持创建新的元组
Foolmoron,2016年

8

尽管此问题询问的是按类分组属性,但是如果要针对ADO对象(如DataTable)按多列分组,则必须将“新”项分配给变量:

EnumerableRowCollection<DataRow> ClientProfiles = CurrentProfiles.AsEnumerable()
                        .Where(x => CheckProfileTypes.Contains(x.Field<object>(ProfileTypeField).ToString()));
// do other stuff, then check for dups...
                    var Dups = ClientProfiles.AsParallel()
                        .GroupBy(x => new { InterfaceID = x.Field<object>(InterfaceField).ToString(), ProfileType = x.Field<object>(ProfileTypeField).ToString() })
                        .Where(z => z.Count() > 1)
                        .Select(z => z);

1
我无法执行Linq查询“由新的{c.Field <String>(“ Title”),c.Field <String>(“ CIF”)}“组成的c组,您节省了很多时间!最终查询是:“由新{titulo = c.Field <String>(“ Title”),cif = c.Field <String>(“ CIF”)}组成的c组
netadictos

4
var Results= query.GroupBy(f => new { /* add members here */  });

7
没有为先前的答案添加任何内容。
Mike Fuchs

4
.GroupBy(x => x.Column1 + " " + x.Column2)

Linq.Enumerable.Aggregate()此结合甚至可以按动态数量的属性进行分组:propertyValues.Aggregate((current, next) => current + " " + next)
凯·哈特曼

3
这是比任何人都值得称赞的更好的答案。如果可能存在组合的实例,其中对于column1不同的情况,添加到column2的column1将等于同一事物(“ ab”“ cde”将匹配“ abc”“ de”)的情况。就是说,如果您不能使用动态类型,那么这是一个很好的解决方案,因为您是在group by之后用单独的表达式预构造lambda。
布兰登·巴克利

3
实际上,“ ab”,“ cde”不应与“ abc”,“ de”匹配,因此介于两者之间。
凯·哈特曼

1
那“ abc de”“”和“ abc”“ de”呢?
AlbertK

我猜@AlbertK不能用。
凯·哈特曼



1

需要注意的一点是,您需要为Lambda表达式发送一个对象,并且不能为类使用实例。

例:

public class Key
{
    public string Prop1 { get; set; }

    public string Prop2 { get; set; }
}

这将编译,但每个周期将生成一个密钥

var groupedCycles = cycles.GroupBy(x => new Key
{ 
  Prop1 = x.Column1, 
  Prop2 = x.Column2 
})

如果您不想命名关键属性,然后检索它们,则可以这样做。这将GroupBy正确并为您提供关键属性。

var groupedCycles = cycles.GroupBy(x => new 
{ 
  Prop1 = x.Column1, 
  Prop2= x.Column2 
})

foreach (var groupedCycle in groupedCycles)
{
    var key = new Key();
    key.Prop1 = groupedCycle.Key.Prop1;
    key.Prop2 = groupedCycle.Key.Prop2;
}

0

对于VB匿名/ lambda

query.GroupBy(Function(x) New With {Key x.Field1, Key x.Field2, Key x.FieldN })
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.