Questions tagged «aggregate»

汇总是指汇总分组数据的过程,通常用于统计。

14
按多列分组
如何在LINQ中对多个列进行分组 在SQL中与此类似: SELECT * FROM <TableName> GROUP BY <Column1>,<Column2> 如何将其转换为LINQ: QuantityBreakdown ( MaterialID int, ProductID int, Quantity float ) INSERT INTO @QuantityBreakdown (MaterialID, ProductID, Quantity) SELECT MaterialID, ProductID, SUM(Quantity) FROM @Transactions GROUP BY MaterialID, ProductID
967 c#  .net  linq  group-by  aggregate 

12
LINQ聚合算法介绍
这听起来有些la脚,但我一直无法找到关于的很好的解释Aggregate。 好的意味着简短,描述性的,全面的,并带有一个小而清晰的例子。
721 c#  .net  linq  aggregate 


14
如何按组对变量求和
我有两列的数据框。第一列包含诸如“第一”,“第二”,“第三”之类的类别,第二列具有代表我从“类别”中看到特定组的次数的数字。 例如: Category Frequency First 10 First 15 First 5 Second 2 Third 14 Third 20 Second 3 我想按类别对数据进行排序,并对所有频率求和: Category Frequency First 30 Second 5 Third 34 我将如何在R中执行此操作?
357 r  dataframe  aggregate  r-faq 



7
熊猫分组和
我正在使用此数据框: Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes 10/7/2016 Bob 1 Grapes …

8
每组汇总/汇总多个变量(例如,总和,均值)
从数据帧,是否有聚集(一个简单的方法sum,mean,max同时等c)中多个变量? 以下是一些示例数据: library(lubridate) days = 365*2 date = seq(as.Date("2000-01-01"), length = days, by = "day") year = year(date) month = month(date) x1 = cumsum(rnorm(days, 0.05)) x2 = cumsum(rnorm(days, 0.05)) df1 = data.frame(date, year, month, x1, x2) 我想同时按年份和月份汇总数据框中的x1和x2变量df2。以下代码汇总了x1变量,但是也可以同时汇总x2变量吗? ### aggregate variables by year month df2=aggregate(x1 ~ year+month, data=df1, sum, na.rm=TRUE) head(df2) …

3
使用pandas GroupBy.agg()对同一列进行多次聚合
是否有熊猫内置的方法将两个不同的聚合函数f1, f2应用于同一列df["returns"],而无需agg()多次调用? 示例数据框: import pandas as pd import datetime as dt pd.np.random.seed(0) df = pd.DataFrame({ "date" : [dt.date(2012, x, 1) for x in range(1, 11)], "returns" : 0.05 * np.random.randn(10), "dummy" : np.repeat(1, 10) }) 语法上错误但直观上正确的方法是: # Assume `f1` and `f2` are defined for aggregating. df.groupby("dummy").agg({"returns": f1, "returns": f2}) 显然,Python不允许重复的键。还有其他表达方式agg()吗?也许元组列表[(column, …

14
计算每个组中的行数
我有一个数据框,我想计算每个组中的行数。我通常使用该aggregate函数对数据求和,如下所示: df2 <- aggregate(x ~ Year + Month, data = df1, sum) 现在,我想对观察值进行计数,但似乎找不到的正确论点FUN。凭直觉,我认为应该是这样的: df2 <- aggregate(x ~ Year + Month, data = df1, count) 但是,没有这种运气。 有任何想法吗? 一些玩具数据: set.seed(2) df1 <- data.frame(x = 1:20, Year = sample(2012:2014, 20, replace = TRUE), Month = sample(month.abb[1:3], 20, replace = TRUE))
121 r  dataframe  aggregate  r-faq 


3
熊猫按分组依据求和,但排除某些列
在Pandas数据框上进行分组的最佳方法是什么,但要从该分组中排除一些列呢?例如我有以下数据框: Code Country Item_Code Item Ele_Code Unit Y1961 Y1962 Y1963 2 Afghanistan 15 Wheat 5312 Ha 10 20 30 2 Afghanistan 25 Maize 5312 Ha 10 20 30 4 Angola 15 Wheat 7312 Ha 30 40 50 4 Angola 25 Maize 7312 Ha 30 40 50 我想对“国家”和“项目代码”列进行分组,仅计算Y1961,Y1962和Y1963列下的行总和。结果数据框应如下所示: Code Country Item_Code …

7
像kayak.com这样的网站如何汇总内容?[关闭]
已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 4年前关闭。 改善这个问题 问候,我一直在想一个新项目,并且想知道是否有人对像Kayak.com这样的服务如何能够如此快速,准确地聚合来自许多来源的数据有任何想法。更具体地说,您认为Kayak.com正在与API进行交互还是为了满足用户请求而爬行/抓取了航空公司和酒店网站?我知道对这种事情没有一个正确的答案,但我很好奇知道别人认为这是解决此问题的好方法。如果有帮助,请假装明天创建kayak.com ...您的数据来自哪里?


6
按组提取与变量最小值对应的行
我希望(1)将数据按一个变量()分组State,(2)在每个组中找到另一个变量(Employees)的最小值行,以及(3)提取整行。 (1)和(2)是简单的一线客,我觉得(3)也是,但我无法理解。 这是一个示例数据集: > data State Company Employees 1 AK A 82 2 AK B 104 3 AK C 37 4 AK D 24 5 RI E 19 6 RI F 118 7 RI G 88 8 RI H 42 data <- structure(list(State = structure(c(1L, 1L, 1L, 1L, 2L, 2L, …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.