RMSE与确定系数


21

我正在评估一个物理模型,并想知道我应该在此处使用哪种方法(介于RMSE和测定系数R2之间)

问题是如下:我有一个功能,输出预测为输入值x,。对于这个值,我也有实际的观察,即y xyx¯=f(x)yx

我的问题是RMSE或的优缺点是什么。我已经看到他们都在论文中用于解决我正在研究的问题。R2

Answers:


16

我都使用了它们,并提出了几点要点。

  • Rmse非常有用,因为它很容易解释。每个人都知道它是什么。
  • Rmse不显示相对值。如果,则必须明确知道范围α < y x < β。如果α = 1 β = 1000,则0.2是一个好值。如果α = 0 β = 1,似乎不再那么好了。rmse=0.2α<yx<βα=1,β=1000α=0,β=1
  • 与以前的方法保持一致,rmse是隐藏您所调查的人或您进行的测量大多是统一的(每个人对产品评分为3星)的事实的好方法,并且由于数据的帮助,您的结果看起来不错。如果数据有点随机,您会发现模型围绕木星运行。
  • 使用调整后的确定系数,而不是普通的R2
  • 确定系数很难解释。即使是实地人士,也需要\ footnote {这样的注脚提示。调整后的确定系数是数据集中可变性的比例,可以用统计模型来解释。该值表明该模型可以预测未来的结果。最小值为0,最大值为1。}R2
  • 但是,确定系数非常准确地告诉您模型对现象的解释程度。如果,无论y x值如何,您的模型都是不好的。我认为,好的模型的临界点从0.6开始,如果您的系数在0.7-0.8左右,那么您的模型就是非常好的模型。R2=0.2yx
  • 概括地说,表示,使用您的模型,您可以解释实际数据中70%的情况。其余的30%是您不知道且无法解释的内容。可能是因为存在混杂因素,或者您在构建模型时犯了一些错误。R2=0.7
  • 在计算机科学中,几乎每个人都使用rmse。社会科学使用更经常 2R2
  • 如果不需要在模型中证明参数合理,只需使用rmse。但是,如果在构建模型时需要放入,删除或更改参数,则需要使用来表明这些参数可以最好地解释数据。R2
  • 如果您将使用,请使用R语言进行编码。它具有库,您只需为其提供数据即可获得所有结果。R2

对于一个有抱负的计算机科学家来说,写有关统计数据真是令人激动。敬上。


8
This value shows how well future outcomes can be predicted by the model-这是极易引起误解的,倾向于纯粹的错误。无法保证给定模型中的高确定性系数与未来结果的预测程度有关。
Prophet60091

5
我认为像“语句,如果的模型是坏的R2=0.2 ”,“ 你的模型是非常好的R2=0.70.8 ”是总的概括。如果有什么事情的真实世界问题的的0.8将使强烈怀疑过学习的问题...R2
usεr11852说恢复单胞菌

3
如果 = 0.2,则不管yx值如何,您的模型都是不好的。我认为,好的模型的临界点从0.6开始,如果您的系数在0.7-0.8之间,那么您的模型是非常好的模型。这在很大程度上取决于您所从事的领域。想象一下,您尝试预测明年的堆栈交换相关索引。您将成为R 2为0.2 的世界首富。R2R2
Jan Hackenberg

我同意Jan Hackenberg和Prophet60091。您的部分答案肯定是错误的,我不明白为什么这是公认的答案,人们对此表示反对。其实,这很可能意味着,人们正在使用他们的指标不知道如何解释他们..
线Kaldemeyer

9

无论您进行哪种Errror测量,都应考虑在附录中给出完整的结果向量。愿意与您的方法进行比较但更喜欢另一种误差度量的人可以从表中得出该值。

R2

  • 不反映系统错误。假设您测量的是直径而不是圆形物体的半径。您的预期高估为100%,但仍可以达到接近1 的R2

  • 与先前的意见不同,难以理解。值越高,您的模型越精确,但其中可能包含系统误差。R2

  • 可以用易于理解的公式表示,您可以在其中建立残差平方和与平均数的比值:

R2=1SSEmean=1(yiyi¯)2(yiy¯)2

  • Radj.2

RMSE

  • RMSERMSER2

  • rel.RMSErel.RMSE

正如其他人所提到的,选择可能取决于您的领域和技术水平。是否也有一种公认的比较方法?使用与他们相同的度量,您就可以轻松地在讨论中直接链接您的方法的好处。


7

无论是根均方误差(RMSE)确定系数([R2提供了不同但互补的信息,这些信息应在评估您的物理模型时进行评估。两者都不是“更好”的,但是根据特定的应用程序,有些报告可能会更侧重于一个指标。

我将使用以下内容作为了解两个指标之间差异的非常一般的指南:

RMSE给你的你的预测值有多接近(或远)来自您正试图模型中的实际数据的意义。这在希望了解模型预测的准确性和精确度的各种应用中很有用(例如,建模树的高度)。

优点

  1. 相对容易理解和交流,因为报告的值与要建模的因变量的单位相同。

缺点

  1. 它对大错误敏感(对大预测错误的惩罚大于对小预测错误的惩罚)。

所述确定的系数([R2在您试图了解所选自变量对因变量的变异性的理解程度时非常有用。当您试图解释哪些因素可能在推动潜在的关注过程(例如,与树木高度相关的气候变量和土壤条件)时,这很有用。

优点

  1. 总体了解所选变量对数据的拟合程度。

缺点

  1. 随着更多自变量被添加到模型中, [R2增加(见ADJ。[R2Akaike的信息标准作为替代方案)。

当然,以上内容取决于样本量和样本设计,并且一般理解为相关并不意味着因果关系。


1

There is also MAE, Mean Absolute Error. Unlike RMSE, it isn't overly sensitive to large errors. From what I've read, some fields prefer RMSE, others MAE. I like to use both.


0

Actually,for statistical scientists should know the best fit of the model,then RMSE is very important for those people in his robust research.if RMSE is very close to zero,then the model is best fitted.

确定系数对农业和其他领域的其他科学家来说是好的。它是介于0和1之间的值。如果为1,则100%的值与观察到的数据集匹配。如果为0,则数据完全异质。印度泰米尔纳德邦韦洛尔VIT大学SK.Khadar Babu博士


0

如果向其中一个向量的每个元素添加一些数字,则RMSE会更改。如果一个或两个向量中的所有元素都乘以一个数字,则相同。R代码如下;

#RMSE vs pearson's correlation
one<-rnorm(100)
two<-one+rnorm(100)

rumis<-(two - one)^2
(RMSE<-sqrt(mean(rumis)))
cor(one,two)

oneA<-one+100

rumis<-(two - oneA)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneA,two)

oneB<-one*10
twoB<-two*10

rumis<-(twoB - oneB)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneB,twoB)
cor(oneB,twoB)^2

0

Ultimately the difference is just standardization as both lead to the choice of the same model, because RMSE times the number of observations is in the numerator or R squared, and the denominator of the latter is constant across all models (just plot one measure against the other for 10 different models).

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.