Questions tagged «ranking»

在某些方面,排名是将给定的刺激或表演者从“最高”到“最低”(或反之亦然)排序的任务或结果。通常将其与刺激等级进行对比。(对于作为数据转换方式的排名-使用标签[ranks])。

5
如何在机器学习中处理分层/嵌套数据
我将用一个例子来解释我的问题。假设您要根据以下属性预测个人的收入:{年龄,性别,国家/地区,城市}。你有一个像这样的训练数据集 train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 1 1 2 62 M 71 4 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

4
从多个变量创建质量索引以启用排名
我有四个数值变量。它们都是土壤质量的量度。变量越高,质量越高。它们的范围都不同: Var1从1到10 Var2从1000到2000 Var3从150到300 Var4从0到5 我需要将四个变量组合为单个土壤质量得分,这样才能成功地排名顺序。 我的想法很简单。标准化所有四个变量,对其求和,得到的分数就是排名。您是否发现使用此方法有任何问题。您还有其他建议(更好)的方法吗? 谢谢 编辑: 多谢你们。关于“领域专业知识”的讨论很多。农业方面的。。。但是我期望更多的统计讨论。就我将要使用的技术而言……这可能是简单的z分数求和+ logistic回归作为实验。因为绝大多数样本的质量差90%,所以我将把3个质量类别合并为一个样本,并且基本上都存在二元问题(质量与不质量)。我用一块石头杀死了两只鸟。我会增加事件发生率的样本,并通过让专家对样本进行分类来利用专家。然后,将使用专家分类的样本来拟合log-reg模型,以最大程度地提高与专家的一致/不一致的程度。...这对您来说听起来如何?

4
如何开始基于成对竞争数据的评级和排名?
在学习如何对仅以成对方式交互/竞争的组中的个人进行评分和排名(即像国际象棋的ELO评分系统之类的系统)时,我很有趣。 是否有任何可行的方法或更准确,更高级的方法? 是否有任何R包可以简化实施? 有没有可以使用辅助信息以及比赛/比赛结果的方法? 有什么方法可以更好地利用赢利信息而不是二分赢/输呢? 我应该在文献中寻找什么?

4
衡量每队2人参加的个人运动员效率
我有一些团队得分的电子表格。一线队以10分获胜。每队有2名球员。尽管并非是随机选择的,但玩家始终与不同的队友一起玩。不保留任何个人分数。 所以基本上我们有Bill和Bob击败Andy和Alice 10-4 Jake,而Bill击败Joe和John 10-8 ... 根据所有可用的比赛数据,是否有可能为各个球员得出一些排名。基本上,要了解每个玩家对每个游戏的贡献或相对于其他玩家的贡献是多少?

4
一个人如何主观排名的结果?
我正在寻找一种可视化主观排名的方法,与我的非参数测试分开。 我已经请12名参与者根据不同的主观标准对8个不同的项目进行排名(每个项目分别进行排名)。对于任何单独的排名,我都在寻找一种可视化排名高级趋势的好方法。 我已经在平均排名上尝试了条形图和雷达图,而且我看到另一个人在每个排名的响应数上使用了散点图/气球图,但是我不确定是什么传达了最好的概观。我可以使用8个平均排名,也可以使用每个项目的每个排名的8个计数。 编辑: 例如:每列是一个项目,每行是一个人对八个项目中每个项目的排名。在此示例中,并不是一个特别强的协议,但总的来说,我们希望了解传达总体趋势的最佳方法。 Item: A B C D E F G H Rater: 1 6 8 1 7 3 4 2 5 2 1 3 8 7 6 5 2 4 3 5 8 7 6 1 4 2 3 4 5 8 7 6 4 2 1 …

3
评估排名算法的指标
我有兴趣查看几种不同的算法排名指标-“学习排名”维基百科页面上列出了一些指标,包括: •平均平均精度(MAP); •DCG和NDCG; •Precision @ n,NDCG @ n,其中“ @n”表示仅对前n个文档评估度量; •平均倒数排名; •肯德尔的牛头 •斯皮尔曼的罗 •预期的相互排名 •Yandex的缺点 但是我不清楚每种方法都有哪些优缺点,或者何时可以选择一种方法而不是另一种方法(或者说一种算法在NDGC上的性能优于另一种算法,而在用MAP评估时更糟,这意味着什么)。 我有什么地方可以了解有关这些问题的更多信息?

3
排名列表比较
假设由和组成的两组分别对从最重要到最不重要的25个项目进行排名。比较这些排名的最佳方法是什么?n 2ñ1个n1n_1ñ2n2n_2 显然,可以进行25个Mann-Whitney U测试,但这将导致需要解释的25个测试结果太多(并且在严格使用中会带来多重比较的问题)。对我来说,还不是很清楚,排名是否满足该测试的所有假设。 我也会对有关评级与排名的文献的指针感兴趣。 背景:这25个项目都与教育有关,并且这两组是不同类型的教育者。两组都很小。 编辑以响应@ttnphns: 我并不是要比较第1组和第2组中项目的总排名-就像@ttnphns指出的那样,这是一个常数。但是第1组和第2组的排名会有所不同;也就是说,第1组的项目1排名可能高于第2组。 我可以逐项比较它们,获取每个项目的均值或中位数排名,并进行25次测试,但是我想知道是否有更好的方法可以做到这一点。


2
将部分排名列表转换为全局排名
我正在研究以下问题。我有一堆用户和N本书。每个用户都会为他阅读的所有图书(可能是N本书的子集)创建一个有序的排名,例如,Book 1> Book 40> Book 25。 现在,我想将这些个人用户排名转换为所有书籍的单一排序排名。 是否有任何好的或标准的方法可以尝试?到目前为止,我正在考虑将Bradley-Terry模型应用于成对比较,但是我想知道是否还有其他功能。

5
如何证明Elo评分或Page排名对我的作品有意义?
我有一组球员。他们互相对抗(成对)。对玩家是随机选择的。在任何游戏中,一名玩家获胜,另一名玩家输。玩家彼此玩有限数量的游戏(有些玩家玩更多的游戏,有些玩的更少)。因此,我有数据(谁赢得了谁,赢得了多少次)。现在,我假设每个玩家的排名都决定了获胜的可能性。 我想检查一下这个假设是否真的是事实。当然,我可以使用Elo评分系统或PageRank算法来计算每个玩家的评分。但是,通过计算等级,我不能证明它们(等级)确实存在或没有任何意义。 换句话说,我想有一种方法来证明(或检查)球员确实有不同的优势。我该怎么做? 添加 更具体地说,我有8位玩家,只有18场比赛。因此,有很多对彼此不对战的玩家,并且有很多对彼此仅玩过一次的玩家。结果,我无法估计给定玩家对获胜的可能性。例如,我还看到有一个玩家在6场比赛中赢得了6次胜利。但这也许只是一个巧合。

3
来自多个排名列表的总体排名
我浏览了很多在线文献,包括没有运气的这个论坛,希望有人可以帮助解决我目前面临的统计问题: 我有5个排名数据列表,每个列表包含从位置1(最佳)到位置10(最差)排名的10个项目。出于上下文考虑,每个列表中的10个项目都是相同的,但是由于用于确定其排名的技术不同,因此排名顺序不同。 示例数据: List 1 List 2 List 3 ... etc Item 1 Ranked 1 Ranked 2 Ranked 1 Item 2 Ranked 3 Ranked 1 Ranked 2 Item 3 Ranked 2 Ranked 3 Ranked 3 ... etc 我正在寻找一种方法来解释和分析上述数据,以便最终得出基于每个测试及其位置的每个项目的总体排名,例如 Result Rank 1 = Item 1 Rank 2 = Item 3 Rank …

5
如何衡量SE贡献者的“全面性”?
众所周知,Stack Exchange是具有不同主题的问答站点的集合。假设每个站点彼此独立,给定用户拥有的统计信息,与下一个家伙相比,如何计算他的“全面性”?我应该使用什么统计工具? 老实说,我不太了解如何数学上定义“全面性”,但是它必须具有以下特征: 在所有条件都相同的情况下,用户代表越多,他的能力就越全面 在所有条件平等的情况下,用户参与的站点越多,他的能力就越全面。 答案或问题不会影响全面性

3
Logistic回归中的排名功能
我使用了Logistic回归。我有六个功能,我想知道此分类器中比其他功能更能影响结果的重要功能。我使用了Information Gain,但似乎并不依赖于所使用的分类器。是否有任何方法可以根据特定的分类器(例如Logistic回归)根据其重要性对特征进行排名?任何帮助将不胜感激。

1
如何衡量共识等级的可靠性(来自Kemeny-Snell书中的问题)
假设 kkk 每个专家都被要求对一组 nnn对象的顺序或偏好。让我们在排名中平分秋色。 John Kemeny和Laurie Snell在其1962年的著作“社会科学中的数学模型”中提出了解决下一个问题的建议: 项目 111。 制定衡量共识排名可靠性的方法,方法是kkk专家。例如,这可以基于通过改变单个专家的排名可以带来的最大可能的改变。(必须注意多重共识排名的可能性。)证明一些定理,关于给定值的最可靠和最不可靠的共识kkk。 本书给出了排名的注释和排名聚合的方法(即,从许多“个人”那里获得一个“集体”排名)。但是对于以上问题没有给出答案。 首先,我想到了肯德尔的WWW一致性系数,但看起来不合适。任何想法都欢迎!

3
机器学习排名算法
我有一组元素,我可以根据特征来描述它们。从而:XXXññn X一世:{C我1,C我2,… ,C我ñ} |X一世∈ XX一世:{C一世1个,C一世2,…,C一世ñ}∣X一世∈Xx_i: \{c_{i1}, c_{i2}, \ldots, c_{in}\} \mid x_i \in X 其中是根据特性对元素的(数值)评估。因此,我的元素可以视为维空间中的点。C我ĴC一世Ĵc_{ij}一世一世iĴĴjññn 根据我的阅读,存在诸如“贝叶斯分类器”之类的算法,可以对我的集合中的任何元素提供“是”或“否”类型的答案,但前提是我确实使用了由一些我的集合中的元素以及算法的预期结果。基于该数据,该算法应该能够采用任何其他元素,而不是训练集的一部分,并根据从训练集中学到的知识提供“是”或“否”的答案。如果您对期望的内容(训练集)有某种想法,但不确定如何产生此结果的特定规则,那么这很好。 我想对数据进行的处理不会得到“是”或“否”类型的答案,但是我想在元素中引入一个排名。其中一些比其他“更好”。就像贝叶斯过滤器一样,我对期望值有一个大致的了解。因此,我可以从元素的子集中生成一个“培训排名”,并将其输入到MLA中。根据该训练,我可以对我的整个作品进行排名。 为此,我看到两种方法: MLA将为每个元素评分,然后根据该评分对元素进行排名。 MLA可以采用两个元素和并确定其中一个更好(成对比较)。使用该比较操作使用quicksort。X一世X一世x_iXĴXĴx_j 注意:基于分数,成对函数很容易实现,而基于成对函数,生成分数很简单,因此这只是两个产生相同结果的方法。 是否有MLA可以提供评分功能或成对比较功能的示例? 编辑:为了添加更多上下文:当前,我的项目是根据一种算法进行排名的,该算法通过对进行计算来生成每个项目的得分(实数)。尽管生成的排名非常正确,但是我经常必须修改算法以某种方式对其进行调整,因为我可以清楚地看到一些未按我期望的排名的项目。C一世ĴC一世Ĵc_{ij} 所以目前我的设计过程是: 了解什么是完美的排名 尝试(手动)派生一个算法来对此类项目进行排名 观察结果 调整算法 所以我考虑了MLA,因为我的过程的起点就是可以用作训练数据。我可能会以当前的排名开始,根据我的需求交换项目并将其提供。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.