大家。任何人都可以在以下方面帮助我吗?任何指针或协助,不胜感激!
我有+500,000行的数据集的子集,看起来像这样
|— Group —|— Name —|— Value1 —|— Value2 —|
在每个组中,我试图确定值1的前5个和前10个百分位数中的名称,以便我可以继续为每个已确定的百分位数计算值2的总和。
到目前为止,我已经能够创建一个像这样的数据透视表。
|----------|--Sum Val1--|--Sum Val2--|
|--GroupA--|----------| Totals for GroupA
|----------|-Name A1--| Values.......
|----------|-Name A2--| Values.......
...
|----------|-Name An--| Values.......
|--GroupB--|----------| Totals for GroupB
... Values.......
|--GroupZ--|----------| Totals for GroupZ
我可以手动识别百分位数,但我想有一种更简单的方法。我已经进行了几次搜索,但只遇到在整个数据集中查找百分位数的过程。
1
您似乎正在显示一些数据的标题行,以及一个中间工作产品的示意图,您认为这可能是有用的,但没有获得所需的结果。尝试发布一些实际数据以及标题和模板,以及表示所需的输入数据结果。它不必是真实的实时数据-实际上,最好不是这样。组可以是“猫”,“狗”,“狐狸”,“红色”,“蓝色”,“绿色”等。名称可以是“ Tom”,“ Dick”,“ Harry”,“ John”,Paul”,George”和“ Ringo”;值可以是1、2、4、8、10、20、40、80。…(续)
—
G-Man
我认为不会有简单的方法。您可能需要辅助列,用于按类别(
—
朱塔什(MátéJuhász)
SUMIF
)和百分位数(LARGE
,SUMIFS
)计算总和。