来自多个排名列表的总体排名


13

我浏览了很多在线文献,包括没有运气的这个论坛,希望有人可以帮助解决我目前面临的统计问题:

我有5个排名数据列表,每个列表包含从位置1(最佳)到位置10(最差)排名的10个项目。出于上下文考虑,每个列表中的10个项目都是相同的,但是由于用于确定其排名的技术不同,因此排名顺序不同。

示例数据:

            List 1      List 2      List 3     ... etc
Item 1     Ranked 1    Ranked 2    Ranked 1     
Item 2     Ranked 3    Ranked 1    Ranked 2
Item 3     Ranked 2    Ranked 3    Ranked 3
... etc

我正在寻找一种方法来解释和分析上述数据,以便最终得出基于每个测试及其位置的每个项目的总体排名,例如

Result
Rank 1 = Item 1
Rank 2 = Item 3
Rank 3 = Item 4
... etc

到目前为止,我已经尝试通过执行Pearson的相关性,Spearman的相关性,Kendall Tau的B和Friedman检验来解释此信息。但是,我发现这些结果通常将我的列表配对(即,将列表1与列表2进行比较,然后将列表1与列表3进行比较。等等),或者产生关于总体的卡方值,P值等结果数据。

有谁知道我可以用一种统计上合理的方法(在研究生/博士学位适用的水平上)来解释这些数据,以便使我能够理解表明5个测试中每个项目的重要性的总体排名?或者,如果有其他类型的技术或统计测试,我可以研究一下,我将不胜感激任何提示或指导。

(也许还值得注意的是,我还执行了一些简单的数学技术,例如求和,求平均值,最小-最大检验等,但在这些意义上,它们在统计上并不足够重要)。

任何帮助或建议,将不胜感激,谢谢您的时间。


1
我发现两个问题,经过适当解释,似乎是重复的(因此已经提供了答案):stats.stackexchange.com/search?q=valuation+rank。这些足够吗?如果没有,请帮助我们了解您情况的特殊之处。
whuber

感谢您的答复。我看过这些文章,但不确定它们不是我想要的东西,还是我的理解有误。在这些文章中,我给人的印象是每个数据集都有许多含义不同的变量,并且秩可以不同,或者具有比整数更多的细节整数值。我只是在寻找一种经过统计证明的方法,以便能够说“总体上最重要的项目是X,然后是Y ...,最后是(或最不重要的)项目Z”。我几乎要考虑将这些排名1-10作为纯数字进行分析
Liam

1
这些线程的主要要点是,不存在任何这种“经过统计证明的方式”。这是一个估值问题:结果的任何统计组合都反映了它们之间的权衡感。例如,您的“物体”可能是汽车,而“技术”则可能根据各种属性对它们进行排名:成本,燃油效率,功率,舒适性等。您个人对“最佳”的感觉可能与其他人的感觉有很大不同,并且你们俩都是对的。
whuber

你得到答案了吗?请留下评论点击这里stats.stackexchange.com/questions/347336/...
雷打码机

Answers:


7

我不确定为什么您要查看相关性和类似的度量。似乎没有任何关联。

相反,有很多选择,没有一个比另一个真正,但是取决于您想要的是:

取平均排名,然后对平均值进行排名(但这会将数据视为间隔)

进行中位数排名,然后对中位数进行排名(但这可能会导致平局)

取每个项目获得的第一名票数,并以此为基础对其进行排名

最后一票的票数,并据此对票进行排名(显然是相反的)。

根据您认为合理的情况,创建一些加权的等级组合。


4
我在评论中引用的线程中有一个重要的观点-我认为这是整个问题的症结-所有这些方法都是任意的。存在客观的方法,但是它们需要使用数据中固有的信息。这就是使这成为估值问题而不是统计问题的原因。
whuber

您会建议哪种加权等级组合?
Archie

4

正如其他人指出的那样,您可能有很多选择。我推荐的方法基于平均排名,即Peter的第一个建议。

在这种情况下,可以通过两步统计检验来检查最终排名的统计重要性。这是一个非参数过程,包括Friedman检验和相应的事后检验,即Nemenyi检验。两者都是基于平均排名。弗里德曼测试的目的是拒绝零假设,并得出这样的结论该项目之间存在一些差异。如果是这样,我们将继续进行Nemenyi测试,以找出哪些项目实际上有所不同。(为了避免偶然发现重要性,我们不直接从事后测试开始。)

更多详细信息,例如这两个测试的临界值,可以在Demsar的论文中找到


2

使用Tau-x(其中“ x”表示“扩展” Tau-b)。Tau-x是Kemeny-Snell距离度量的相关性等效项-被证明是满足距离度量的所有要求的排名项目列表之间的唯一距离度量。参见Kemeny和Snell撰写的“社会科学数学模型”第2章,以及“将新的等级相关系数应用于共识等级问题”,Edward Emond,David Mason,《多标准决策分析杂志》,11:17- 28(2002)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.