Questions tagged «rating»

“评分是指对某种事物的评估或评估,包括质量(如评论家对小说的评分),数量(如运动员根据其统计数据进行评分)或两者的某种组合”(维基百科)。

3
示例:使用glmnet获得二进制结果的LASSO回归
我开始与使用的涉猎glmnet与LASSO回归那里我感兴趣的结果是二分。我在下面创建了一个小的模拟数据框: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, 2, 2, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

4
如何开始基于成对竞争数据的评级和排名?
在学习如何对仅以成对方式交互/竞争的组中的个人进行评分和排名(即像国际象棋的ELO评分系统之类的系统)时,我很有趣。 是否有任何可行的方法或更准确,更高级的方法? 是否有任何R包可以简化实施? 有没有可以使用辅助信息以及比赛/比赛结果的方法? 有什么方法可以更好地利用赢利信息而不是二分赢/输呢? 我应该在文献中寻找什么?

2
根据PCA / FA中保留的几个主要成分或因素创建一个索引
我正在使用主成分分析(PCA)创建研究所需的索引。我的问题是我应该如何使用通过PCA计算出的保留主成分来创建单个索引。 例如,在使用PCA之后,我决定保留3个主要成分,并计算了这3个主要成分的得分。为每位受访者从这三个分数中创建一个索引的合适方法是什么? 将3个计算所得的分数相加得到一个复合值是否有意义? 还是将这3个分数取平均值才能获得这样的价值? 还是只保留第一个主成分(最强)并将其分数用作索引? 或者,可以使用因子分析(FA),但仍然存在相同的问题:如何基于多个因子得分创建单个索引?

5
如何证明Elo评分或Page排名对我的作品有意义?
我有一组球员。他们互相对抗(成对)。对玩家是随机选择的。在任何游戏中,一名玩家获胜,另一名玩家输。玩家彼此玩有限数量的游戏(有些玩家玩更多的游戏,有些玩的更少)。因此,我有数据(谁赢得了谁,赢得了多少次)。现在,我假设每个玩家的排名都决定了获胜的可能性。 我想检查一下这个假设是否真的是事实。当然,我可以使用Elo评分系统或PageRank算法来计算每个玩家的评分。但是,通过计算等级,我不能证明它们(等级)确实存在或没有任何意义。 换句话说,我想有一种方法来证明(或检查)球员确实有不同的优势。我该怎么做? 添加 更具体地说,我有8位玩家,只有18场比赛。因此,有很多对彼此不对战的玩家,并且有很多对彼此仅玩过一次的玩家。结果,我无法估计给定玩家对获胜的可能性。例如,我还看到有一个玩家在6场比赛中赢得了6次胜利。但这也许只是一个巧合。

2
情报平方计分和获胜者确定
有一个称为“情报平方”的NPR播客。每集都播放有关一些争议性声明的现场辩论,例如“第二修正案不再相关”或“对大学校园采取平权行动弊大于利”。四名代表辩论,两名代表议案,两名反对。 为了确定哪一方获胜,在辩论前后都要对观众进行投票。从绝对百分比上获得更多收益的一方被视为获胜者。例如: For Against Undecided Before 18% 42% 40% After 23% 49% 28% Winner: Against team -- The motion is rejected. 直觉上,我认为这种衡量成功的方法是有偏见的,我想知道如何以公平的方式对听众进行投票以确定赢家。 我立即在当前方法中看到了三个问题: 在极端情况下,如果一方以100%达成共识,那么他们只能平局或输球。 如果没有未定的决定,则初始协议较少的那一侧可被视为具有较大的样本量,可从中进行抽取。 未定的一面不太可能真正地未定。如果我们假设双方是两极分化的,那么如果我们被迫放弃一方,似乎我们先前对未定人群的信念应该是。Beta (#赞成,#反对)Beta(# For,# Against)\text{Beta}(\text{# For}, \text{# Against}) 鉴于我们必须依靠受众调查,是否有更公平的方法来判断谁获胜?
12 bayesian  rating 

2
某人会喜欢图像的可能性
我遇到以下问题: -我们设置了N个人 -我们设置了K张图片 -每个人都对一定数量的图片进行评分。一个人可能喜欢或不喜欢图像(这是仅有的两个可能性)。-问题是如何计算某些人喜欢特定图像的可能性。 我将举例说明我的直觉。 N = 4 K = 5 +表示该人喜欢该图像 -表示该人不喜欢该图像 0表示尚未向该人询问该图像,并且应该预测该值 x 1 2 3 4 5 1 + - 0 0 + 2 + - + 0 + 3 - - + + 0 4 - 0 - - - 人1可能喜欢图像3,因为人2具有相似的偏好,人2喜欢图像3。 人4可能不喜欢图像2,因为没有人喜欢它,另外人4不喜欢大多数图像。 有没有众所周知的方法可以用来计算这种可能性?

3
如何订购或排列一组专家?
我有一个数据库,其中包含一个领域的大量专家。对于每个专家,我都有各种属性/数据点,例如: 多年的经验。 执照 评论数量 这些评论的文字内容 这些评论中的每条评论均获得5星评分,其中包括速度,质量等诸多因素。 奖项,协会,会议等 我想根据他们的重要性给这些专家说10分。一些专家可能缺少一些数据点。现在我的问题是如何提出这样的算法?谁能指出我一些相关的文献? 我也担心,与所有评分/评论一样,该数字可能会在一些值附近聚集。例如,其中大多数可能最终得到8或5。是否有一种方法可以仅将某些属性突出显示小差异,使得分差异更大。 我认为其他一些讨论可能是相关的: 贝叶斯评分系统,每个评分具有多个类别 您将如何计算IMDB电影分级? 选拔专家 输入为上下投票的最佳排名算法是什么?
11 rating  valuation 

1
为什么Elo评分系统使用错误的更新规则?
Elo评级系统使用成对比较中预期和观察到的结果概率之间的交叉熵损失函数的梯度下降最小化算法。我们可以写成一般的损失函数为 Ë= - Σñ ,我p一世大号Ò 克(q一世)E=−∑n,ipiLog(qi) E=-\sum_{n,i} p_i Log (q_i) 其中所有结果和所有反对者的总和。 是事件的所观察到的频率和预期频率。Ñ p 我我q 我一世iiñnnp一世pip_i一世i_iq一世qiq_i 如果只有两个可能的结果(赢或输)和一个对手 Ë= - p 大号ö 克(q)− (1 − p )L o g(1 − q)E=−pLog(q)−(1−p)Log(1−q) E=-p Log (q)-(1-p)Log(1-q) 如果是玩家的排名,而是玩家的排名,我们可以建立期望概率为 然后使用梯度下降更新规则我π Ĵ Ĵ q 我 = È π 我π一世πi\pi_i一世iiπĴπj\pi_jĴjj qĴ=È π Ĵq一世= eπ一世Ëπ一世+ eπĴqi=eπieπi+eπj q_i=\frac{e^{\pi_i}}{e^{\pi_i}+e^{\pi_j}} qĴ= eπĴËπ一世+ …

1
R线性回归分类变量“隐藏”值
这只是我多次遇到的示例,因此我没有任何示例数据。在R中运行线性回归模型: a.lm = lm(Y ~ x1 + x2) x1是一个连续变量。x2是分类的,具有三个值,例如“低”,“中”和“高”。但是,R给出的输出将类似于: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 我知道R在这种因素(x2是一个因素)上引入了某种虚拟编码。我只是想知道,如何解释x2“高”值?例如,x2在此处给出的示例中,“ High” 对响应变量有什么影响? 我在其他地方(例如这里)已经看到了这样的示例,但是还没有找到我能理解的解释。
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
如何公平地确定区域科学博览会的获奖者?
我需要帮助,以找出正确的方法来计算我们的Science Fair获奖者。我不希望我对统计和数学的无知会妨碍孩子获得获胜的机会。(大量的奖学金和晋升福利at可危)。在此先感谢您的帮助。 首先介绍一下我们如何进行设置: 我们的博览会通常有大约600个学生项目。这些项目由单个学生或一组学生完成并介绍。一个团队可以包含2个或3个孩子。 学生分为两个部分:小学(6-8年级)和中学(9-12年级)。每个部门都有不同的类别:小学项目9个类别,中学项目17个类别。 每个部门的每个类别分别获得第一,第二和第三名的奖项。超过第三名的位置也会获得荣誉奖。 对于每个项目,我们分配4至6名法官。我们根据法官的资格,他们的类别偏好和他们过去的评审经验来进行分配。(经验丰富的人员被分配到高级部门的项目中)。 评委如何为项目评分: 对于每个项目,都有5个分配了点的标准。每个标准可以在1到20分之间奖励。一般标准是: 总体目标+假设+资源使用(1..20) 设计+程序(1..20) 数据收集+结果(1..20) 讨论+结论(1..20) 面试(1..20) 对于团队项目,第六个标准被评估为“团队扣除”,在该标准中,法官可以为未参加或未出席的队友扣分(最多15分)。 团队扣除(0 ..- 15) 因此,法官可以为每个项目打5至100分。如果该项目是团队项目,则得分可以降低15分。 原始数据: 在几个小时的过程中,我们从法官那里收集了3600个分数。这些分数被输入到数据库中,我可以在其中进行各种排序,平均,标准差计算等。我只是不知道该如何处理这些原始分数。现在,我正在为每个项目做一个简单的平均,但是我担心我没有针对法官的偏见,团队扣除或其他我没有考虑的其他因素进行调整。 所需结果: 最后,我想对分数进行处理,以便可以为每个类别分别授予第一,第二和第三名,然后为随后的各个地方授予荣誉奖。我想相信位置计算正确,获胜的孩子应该得到认可(和奖金)。 非常感谢您阅读我的冗长问题并为您解决这个问题提供了帮助。我很乐意回答您可能遇到的任何后续问题。

2
权衡评级系统以支持更多人评价较高的项目,而不是更少人评价较高的项目?
在此先感谢您与我保持联系,我不是任何统计学家,也不知道如何描述我的想象,因此Google在这里没有帮助我... 我正在使用一个Web应用程序中包含一个评分系统。每个用户可以对每个项目准确地评分一次。 我正在想象一个带有4个值的标度:“非常不喜欢”,“不喜欢”,“喜欢”和“非常喜欢”,并且我计划分别分配这些值-5,-2,+ 2和+5 。 现在,如果每个项目的评分都相同,那么我将对这种评分系统感到满意,因为它可以区分出最喜欢和最不喜欢的项目。但是,这些项目的评级不会相同,并且不同照片上的投票数之间的差异可能会非常明显。 在那种情况下,比较两个项目的累积得分意味着具有很多中等评级的旧项目的得分将比票数更少的特殊新项目的得分高得多。 因此,我想到的第一件事就是平均得分...但是现在,如果一个项目的评分只有“ +5”,则其平均得分要高于获得99“ +5”评分的项目和1个“ +2”等级。直观地讲,这并不是商品受欢迎程度的准确表示。 我想这个问题很普遍,你们不需要我用更多示例来困扰它,所以我将在这一点上停下来,并在需要时详细说明。 我的问题是: 这种问题叫什么,解决这个问题的技术是否有术语?我想知道这一点,以便我可以继续阅读。 如果您碰巧知道关于该主题的任何非专业资源,我将非常感谢您提供的链接。 最后,对于任何有关如何有效收集和分析此类数据的建议,我将不胜感激。
9 scales  rating 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.