分组最高百分比


2

大家。任何人都可以在以下方面帮助我吗?任何指针或协助,不胜感激!

我有+500,000行的数据集的子集,看起来像这样

|— Group —|— Name —|— Value1 —|— Value2 —|

在每个组中,我试图确定值1的前5个和前10个百分位数中的名称,以便我可以继续为每个已确定的百分位数计算值2的总和。

到目前为止,我已经能够创建一个像这样的数据透视表。

           |----------|--Sum Val1--|--Sum Val2--|
|--GroupA--|----------|     Totals for GroupA
|----------|-Name A1--|     Values.......
|----------|-Name A2--|     Values.......
    ...
|----------|-Name An--|     Values.......
|--GroupB--|----------|     Totals for GroupB
    ...                     Values.......
|--GroupZ--|----------|     Totals for GroupZ

我可以手动识别百分位数,但我想有一种更简单的方法。我已经进行了几次搜索,但只遇到在整个数据集中查找百分位数的过程。


1
您似乎正在显示一些数据的标题行,以及一个中间工作产品的示意图,您认为这可能是有用的,但没有获得所需的结果。尝试发布一些实际数据以及标题和模板,以及表示所需的输入数据结果。它不必是真实的实时数据-实际上,最好不是这样。组可以是“猫”,“狗”,“狐狸”,“红色”,“蓝色”,“绿色”等。名称可以是“ Tom”,“ Dick”,“ Harry”,“ John”,Paul”,George”和“ Ringo”;值可以是1、2、4、8、10、20、40、80。…(续)
G-Man

(续)…请不要在评论中回复;编辑您的问题,使其更清晰,更完整。
G-Man

我认为不会有简单的方法。您可能需要辅助列,用于按类别(SUMIF)和百分位数(LARGESUMIFS)计算总和。
朱塔什(MátéJuhász)

Answers:


1

设置数据透视表的方式,应用排名靠前的10个过滤器可在每个内Names找到顶部。如果要查找整体排名靠前的位置,则必须将该字段放在该字段之前。NamesGroupNamesNamesGroup

这是我制作的模型:

原版的

当我筛选前2名时Names

前2名

当我将其Names作为顶部字段,然后针对顶部2进行过滤时:

更正了前2名


如注释中所建议,您还可以在原始数据中添加帮助器列,以计算每行的影响,然后确定它是否在前10名中并返回TRUE / FALSE。然后,您可以将过滤器应用于数据透视表,以仅在该字段中显示具有TRUE的内容。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.