Questions tagged «group-by»

GROUP BY是SQL关系数据库标准中的命令,用于将共享公共字段值的一组行折叠为单个行。可以对组中的其他字段(例如SUM()或AVG())执行聚合函数,以将相关数据整理为单个值。


2
熊猫Groupby价值范围
大熊猫中是否有一种简单的方法可以groupby按一定范围的值增量进行调用?例如下面给出的示例,我可以B以0.155增量方式对列进行分组和分组,以便例如将列B中的前几对分组划分为'0-0.155、0.155-0.31 ...之间的范围。 import numpy as np import pandas as pd df=pd.DataFrame({'A':np.random.random(20),'B':np.random.random(20)}) A B 0 0.383493 0.250785 1 0.572949 0.139555 2 0.652391 0.401983 3 0.214145 0.696935 4 0.848551 0.516692 或者,我可以先按这些增量将数据分类到新的列中,然后再使用它groupby来确定在列中可能适用的任何相关统计数据A?

6
如何在MySQL中按周分组?
Oracle的表服务器提供了一个内置功能TRUNC(timestamp,'DY')。此函数将任何时间戳转换为前一个星期日的午夜。在MySQL中执行此操作的最佳方法是什么? Oracle还提供TRUNC(timestamp,'MM')了将时间戳转换为发生月份的第一天的午夜。在MySQL中,这很简单: TIMESTAMP(DATE_FORMAT(timestamp, '%Y-%m-01')) 但是这个 DATE_FORMAT技巧将在数周内失效。我知道此WEEK(timestamp)功能,但是我真的不想要一年内的星期数。这些东西是用于多年的工作。


3
熊猫按分组依据求和,但排除某些列
在Pandas数据框上进行分组的最佳方法是什么,但要从该分组中排除一些列呢?例如我有以下数据框: Code Country Item_Code Item Ele_Code Unit Y1961 Y1962 Y1963 2 Afghanistan 15 Wheat 5312 Ha 10 20 30 2 Afghanistan 25 Maize 5312 Ha 10 20 30 4 Angola 15 Wheat 7312 Ha 30 40 50 4 Angola 25 Maize 7312 Ha 30 40 50 我想对“国家”和“项目代码”列进行分组,仅计算Y1961,Y1962和Y1963列下的行总和。结果数据框应如下所示: Code Country Item_Code …


5
列的顺序在group by子句中是否重要?
如果我有两列,一列具有非常高的基数,而另一列具有非常低的基数(值的唯一数目),那么按哪个顺序分组是否重要? 这是一个例子: select dimensionName, dimensionCategory, sum(someFact) from SomeFact f join SomeDim d on f.dimensionKey = d.dimensionKey group by d.dimensionName, -- large number of unique values d.dimensionCategory -- small number of unique values 在某些情况下重要吗?


2
如何从pandas groupby()。sum()的输出中创建新列?
尝试从groupby计算中创建新列。在下面的代码中,我获得了每个日期的正确计算值(请参阅下面的组),但是当我尝试df['Data4']用它创建一个新列()时,我得到了NaN。因此,我正在尝试在数据框中使用Data3所有日期的总和创建一个新列,并将其应用于每个日期行。例如,2015-05-08位于2行中(总计为50 + 5 = 55),在这个新列中,我希望两行都具有55。 import pandas as pd import numpy as np from pandas import DataFrame df = pd.DataFrame({ 'Date' : ['2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05', '2015-05-08', '2015-05-07', '2015-05-06', '2015-05-05'], 'Sym' : ['aapl', 'aapl', 'aapl', 'aapl', 'aaww', 'aaww', 'aaww', 'aaww'], 'Data2': [11, 8, 10, 15, 110, 60, 100, 40], 'Data3': …

5
Python Pandas如何将groupby操作结果分配回父数据帧中的列?
我在IPython中具有以下数据框,其中每一行都是一只股票: In [261]: bdata Out[261]: <class 'pandas.core.frame.DataFrame'> Int64Index: 21210 entries, 0 to 21209 Data columns: BloombergTicker 21206 non-null values Company 21210 non-null values Country 21210 non-null values MarketCap 21210 non-null values PriceReturn 21210 non-null values SEDOL 21210 non-null values yearmonth 21210 non-null values dtypes: float64(2), int64(1), object(4) 我想应用一个groupby操作,计算“ yearmonth”列中每个日期的所有内容的上限加权平均回报。 这按预期工作: …

1
使用分组依据与不同时的巨大性能差异
我正在HSQLDB包含500 000项的表的服务器上执行一些测试。该表没有索引。有5000个不同的业务密钥。我需要他们的清单。自然地,我从DISTINCT查询开始: SELECT DISTINCT business_key FROM memory WHERE concept <> 'case' or attrib <> 'status' or value <> 'closed' 大约需要90秒!!! 然后我尝试使用GROUP BY: SELECT business_key FROM memory WHERE concept <> 'case' or attrib <> 'status' or value <> 'closed' GROUP BY business_key 它需要1秒钟!!! 试图找出我运行的差异,EXLAIN PLAN FOR但似乎为两个查询提供了相同的信息。 EXLAIN PLAN FOR DISTINCT ... …

4
分组数据框并获得总和和计数?
我有一个看起来像这样的数据框: Company Name Organisation Name Amount 10118 Vifor Pharma UK Ltd Welsh Assoc for Gastro & Endo 2700.00 10119 Vifor Pharma UK Ltd Welsh IBD Specialist Group, 169.00 10120 Vifor Pharma UK Ltd West Midlands AHSN 1200.00 10121 Vifor Pharma UK Ltd Whittington Hospital 63.00 10122 Vifor Pharma UK Ltd …


5
按熊猫数据框分组,然后在每组中选择最新的
如何对熊猫数据框的值进行分组并从每个组中选择最新(按日期)? 例如,给定一个按日期排序的数据框: id product date 0 220 6647 2014-09-01 1 220 6647 2014-09-03 2 220 6647 2014-10-16 3 826 3380 2014-11-11 4 826 3380 2014-12-09 5 826 3380 2015-05-19 6 901 4555 2014-09-01 7 901 4555 2014-10-05 8 901 4555 2014-11-01 按ID或产品分组,然后选择最早给出: id product date 2 220 6647 2014-10-16 5 …

3
ILookup <TKey,TVal>与IGrouping <TKey,TVal>
我一直有麻烦之间阐明的差异ILookup&lt;TKey, TVal&gt;和IGrouping&lt;TKey, TVal&gt;,并很好奇,如果我理解正确了。LINQ通过产生IGrouping项目序列使问题更加复杂,同时还提供了ToLookup扩展方法。因此,直到我仔细观察之前,它们似乎都是一样的。 var q1 = from n in N group n by n.MyKey into g select g; // q1 is IEnumerable&lt;IGrouping&lt;TKey, TVal&gt;&gt; 等效于: var q2 = N.GroupBy(n =&gt; n.MyKey, n =&gt; n); // q2 is IEnumerable&lt;IGrouping&lt;TKey, TVal&gt;&gt; 看起来很像: var q3 = N.ToLookup(n =&gt; n.MyKey, n =&gt; n); // q3 …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.