在LINQ中分组


1061

假设我们有一个类似的类:

class Person { 
    internal int PersonID; 
    internal string car; 
}

现在,我有一个此类的清单: List<Person> persons;

现在,此列表可以包含多个具有相同PersonID的实例,例如:

persons[0] = new Person { PersonID = 1, car = "Ferrari" }; 
persons[1] = new Person { PersonID = 1, car = "BMW"     }; 
persons[2] = new Person { PersonID = 2, car = "Audi"    }; 

我有办法分组PersonID并获得他拥有的所有汽车的清单吗?

例如,预期结果将是

class Result { 
   int PersonID;
   List<string> cars; 
}

因此,分组后,我会得到:

results[0].PersonID = 1; 
List<string> cars = results[0].cars; 

result[1].PersonID = 2; 
List<string> cars = result[1].cars;

从我到目前为止所做的事情来看:

var results = from p in persons
              group p by p.PersonID into g
              select new { PersonID = g.Key, // this is where I am not sure what to do

有人能指出我正确的方向吗?


1
还有另一个示例CountSum这里包括stackoverflow.com/questions/3414080/…–
开发人员

@马丁·卡尔曼:我同意克里斯·沃尔什。具有OP的“人员”类(表)的应用很可能已经具有具有usu的“'普通'”“人员”类(表)。属性/列(即姓名,性别,DOB)。OP的“人员”类(表)可能是“正常”“人员”类(表)的子类(表)(即“ OrderItem(s)”类(表) )与“订单(类)”类(表))。如果OP与他的“'普通'”“人员”类(表)处于同一范围内,并且/或者可能对此帖子进行了简化,则OP可能不会使用他将使用的实际名称。
汤姆(Tom),

Answers:


1731

绝对-您基本上想要:

var results = from p in persons
              group p.car by p.PersonId into g
              select new { PersonId = g.Key, Cars = g.ToList() };

或作为非查询表达式:

var results = persons.GroupBy(
    p => p.PersonId, 
    p => p.car,
    (key, g) => new { PersonId = key, Cars = g.ToList() });

基本上,该组的内容(当视为时IEnumerable<T>)是p.car给定键在投影中(在这种情况下)呈现的任何值的序列。

有关如何GroupBy工作的更多信息,请参阅我在Edulinq上有关该主题的帖子

(在上文中,我已重命名PersonIDPersonId,以遵循.NET命名约定。)

另外,您可以使用Lookup

var carsByPersonId = persons.ToLookup(p => p.PersonId, p => p.car);

然后,您可以非常轻松地为每个人购买汽车:

// This will be an empty sequence for any personId not in the lookup
var carsForPerson = carsByPersonId[personId];

11
@jon Skeet如果我想添加其他属性(例如名称
怎么办

22
@Mohammad:然后将其包括在匿名类型中。
乔恩·斯基特

7
@ user123456这是对分组依据的一个很好的解释,它还包括一个按组合键分组的示例:如何:分组查询结果(C#编程指南)
Mathieu Diepman 2015年

14
@Mohammad,您可以执行类似的操作.GroupBy(p => new {p.Id, p.Name}, p => p, (key, g) => new { PersonId = key.Id, PersonName = key.Name, PersonCount = g.Count()}),您将获得所有出现的人,它们的ID,名称以及每个人的出现次数。
克里斯(Chris)

11
@kame:我故意遵循.NET命名约定,基本上是在修改OP的名称。将在答案中阐明这一点。
乔恩·斯基特

52
var results = from p in persons
              group p by p.PersonID into g
              select new { PersonID = g.Key,
                           /**/car = g.Select(g=>g.car).FirstOrDefault()/**/}

37
var results = from p in persons
              group p by p.PersonID into g
              select new { PersonID = g.Key, Cars = g.Select(m => m.car) };

32

您也可以尝试以下操作:

var results= persons.GroupBy(n => new { n.PersonId, n.car})
                .Select(g => new {
                               g.Key.PersonId,
                               g.Key.car)}).ToList();

这是错误的返回相同的列表未分组的依据
Vikas Gupta

它正在工作,我认为缺少某些内容,这就是为什么它在您的代码中不起作用的原因。
Shuvo Sarker

28

尝试

persons.GroupBy(x => x.PersonId).Select(x => x)

要么

检查是否有人在您的列表中重复尝试

persons.GroupBy(x => x.PersonId).Where(x => x.Count() > 1).Any(x => x)

13

我使用查询语法和方法语法创建了一个工作代码示例。我希望它对其他人有帮助:)

您也可以在.Net Fiddle上运行以下代码:

using System;
using System.Linq;
using System.Collections.Generic;

class Person
{ 
    public int PersonId; 
    public string car  ; 
}

class Result
{ 
   public int PersonId;
   public List<string> Cars; 
}

public class Program
{
    public static void Main()
    {
        List<Person> persons = new List<Person>()
        {
            new Person { PersonId = 1, car = "Ferrari" },
            new Person { PersonId = 1, car = "BMW" },
            new Person { PersonId = 2, car = "Audi"}
        };

        //With Query Syntax

        List<Result> results1 = (
            from p in persons
            group p by p.PersonId into g
            select new Result()
                {
                    PersonId = g.Key, 
                    Cars = g.Select(c => c.car).ToList()
                }
            ).ToList();

        foreach (Result item in results1)
        {
            Console.WriteLine(item.PersonId);
            foreach(string car in item.Cars)
            {
                Console.WriteLine(car);
            }
        }

        Console.WriteLine("-----------");

        //Method Syntax

        List<Result> results2 = persons
            .GroupBy(p => p.PersonId, 
                     (k, c) => new Result()
                             {
                                 PersonId = k,
                                 Cars = c.Select(cs => cs.car).ToList()
                             }
                    ).ToList();

        foreach (Result item in results2)
        {
            Console.WriteLine(item.PersonId);
            foreach(string car in item.Cars)
            {
                Console.WriteLine(car);
            }
        }
    }
}

结果如下:

1个
法拉利
宝马
2
奥迪
-----------
1个
法拉利
宝马
2
奥迪


请解释一下代码的作用。这只是一个代码答案,几乎是错误的答案。
V.7

2

尝试这个 :

var results= persons.GroupBy(n => n.PersonId)
            .Select(g => new {
                           PersonId=g.Key,
                           Cars=g.Select(p=>p.car).ToList())}).ToList();

但是从性能角度来看,以下做法在内存使用方面会更好,更优化(当我们的数组包含更多项目(如数百万)时):

var carDic=new Dictionary<int,List<string>>();
for(int i=0;i<persons.length;i++)
{
   var person=persons[i];
   if(carDic.ContainsKey(person.PersonId))
   {
        carDic[person.PersonId].Add(person.car);
   }
   else
   {
        carDic[person.PersonId]=new List<string>(){person.car};
   }
}
//returns the list of cars for PersonId 1
var carList=carDic[1];

4
g.Key.PersonIdg.SelectMany?? 您显然没有尝试过。
Gert Arnold

您写的是我在其中编辑了一些代码并没有对其进行测试。我的主要观点是第二部分。但是无论如何,谢谢您的考虑。当我意识到这是错误的时候,现在编辑该代码为时已晚。因此g.Key替换了g.Key.PersonId,然后选择而不是SelectMany!非常混乱:))))
akazemis,2016年

2
@akazemis:我实际上是在尝试创建(使用与OP的域等效的术语)SortedDictionary <PersonIdInt, SortedDictionary <CarNameString, CarInfoClass>>。我可以使用LINQ获得的最接近的是IEnumerable <IGrouping <PersonIdInt, Dictionary <CarNameString, PersonIdCarNameXrefClass>>>。我结束了使用for循环方法,顺便说一句,速度快了2倍。另外,我将使用:a)foreachvs. for和b)TryGetValuevs. ContainsKey(均为DRY原理-在代码和运行时中)。
汤姆(Tom),

1

另一种执行此操作的方法是选择“不重复” PersonId并使用persons以下方式进行组联接:

var result = 
    from id in persons.Select(x => x.PersonId).Distinct()
    join p2 in persons on id equals p2.PersonId into gr // apply group join here
    select new 
    {
        PersonId = id,
        Cars = gr.Select(x => x.Car).ToList(),
    };

或与流畅的API语法相同:

var result = persons.Select(x => x.PersonId).Distinct()
    .GroupJoin(persons, id => id, p => p.PersonId, (id, gr) => new
    {
        PersonId = id,
        Cars = gr.Select(x => x.Car).ToList(),
    });

GroupJoin在第一个列表(PersonId在我们的例子中为list)中生成一个条目列表,每个条目在第二个列表(的list)中都有一组联接的条目persons


1

以下示例使用GroupBy方法返回按分组的对象PersonID

var results = persons.GroupBy(x => x.PersonID)
              .Select(x => (PersonID: x.Key, Cars: x.Select(p => p.car).ToList())
              ).ToList();

要么

 var results = persons.GroupBy(
               person => person.PersonID,
               (key, groupPerson) => (PersonID: key, Cars: groupPerson.Select(x => x.car).ToList()));

要么

 var results = from person in persons
               group person by person.PersonID into groupPerson
               select (PersonID: groupPerson.Key, Cars: groupPerson.Select(x => x.car).ToList());

或者你可以使用ToLookup,基本上ToLookup使用EqualityComparer<TKey> .Default来比较键,并在使用“分组依据”和“词典”时进行手动操作。我认为这是记忆中的记忆

 ILookup<int, string> results = persons.ToLookup(
            person => person.PersonID,
            person => person.car);

-1

首先,设置您的关键字段。然后包括您的其他字段:

var results = 
    persons
    .GroupBy(n => n.PersonId)
    .Select(r => new Result {PersonID = r.Key, Cars = r.ToList() })
    .ToList()

未评论的答案/代码不是StackOverflow的工作方式...
V.7
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.