我使用pandas作为数据库替代品,因为我有多个数据库(oracle,mssql等),并且无法对SQL等效命令进行一系列命令。
我在DataFrame中加载了一个带有一些列的表:
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
在SQL中,每年计算不同客户端的数量将是:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
结果将是
201301 5000
201302 13245
如何在熊猫中做到这一点?
我已经完成了table.groupby(['YEARMONTH'])['CLIENTCODE']。unique(),并附带了两个由YEARMONTH索引的系列以及所有唯一值。如何计算每个系列的值数量?
—
阿德里亚诺·阿尔梅达
对于某些人来说,
—
sachinruk
value_counts
可能就是您正在寻找的答案:pandas.pydata.org/pandas-docs/stable/genic / ...