分组最高百分比

大家。任何人都可以在以下方面帮助我吗？任何指针或协助，不胜感激！

我有+500,000行的数据集的子集，看起来像这样

|— Group —|— Name —|— Value1 —|— Value2 —|

在每个组中，我试图确定值1的前5个和前10个百分位数中的名称，以便我可以继续为每个已确定的百分位数计算值2的总和。

到目前为止，我已经能够创建一个像这样的数据透视表。

           |----------|--Sum Val1--|--Sum Val2--|
|--GroupA--|----------|     Totals for GroupA
|----------|-Name A1--|     Values.......
|----------|-Name A2--|     Values.......
    ...
|----------|-Name An--|     Values.......
|--GroupB--|----------|     Totals for GroupB
    ...                     Values.......
|--GroupZ--|----------|     Totals for GroupZ

我可以手动识别百分位数，但我想有一种更简单的方法。我已经进行了几次搜索，但只遇到在整个数据集中查找百分位数的过程。

microsoft-excel pivot-table

— HolaGonzalo
source

您似乎正在显示一些数据的标题行，以及一个中间工作产品的示意图，您认为这可能是有用的，但没有获得所需的结果。尝试发布一些实际数据以及标题和模板，以及表示所需的输入数据结果。它不必是真实的实时数据-实际上，最好不是这样。组可以是“猫”，“狗”，“狐狸”，“红色”，“蓝色”，“绿色”等。名称可以是“ Tom”，“ Dick”，“ Harry”，“ John”，Paul”，George”和“ Ringo”；值可以是1、2、4、8、10、20、40、80。…（续）

— G-Man

（续）…请不要在评论中回复；编辑您的问题，使其更清晰，更完整。

— G-Man

我认为不会有简单的方法。您可能需要辅助列，用于按类别（SUMIF）和百分位数（LARGE，SUMIFS）计算总和。

— 朱塔什（MátéJuhász）

设置数据透视表的方式，应用排名靠前的10个过滤器可在每个内Names找到顶部。如果要查找整体排名靠前的位置，则必须将该字段放在该字段之前。NamesGroupNamesNamesGroup

这是我制作的模型：

当我筛选前2名时Names：

当我将其Names作为顶部字段，然后针对顶部2进行过滤时：

如注释中所建议，您还可以在原始数据中添加帮助器列，以计算每行的影响，然后确定它是否在前10名中并返回TRUE / FALSE。然后，您可以将过滤器应用于数据透视表，以仅在该字段中显示具有TRUE的内容。

— 工程师吐司
source