Answers:
我都使用了它们,并提出了几点要点。
对于一个有抱负的计算机科学家来说,写有关统计数据真是令人激动。敬上。
无论是根均方误差(RMSE)和确定系数()提供了不同但互补的信息,这些信息应在评估您的物理模型时进行评估。两者都不是“更好”的,但是根据特定的应用程序,有些报告可能会更侧重于一个指标。
我将使用以下内容作为了解两个指标之间差异的非常一般的指南:
该RMSE给你的你的预测值有多接近(或远)来自您正试图模型中的实际数据的意义。这在希望了解模型预测的准确性和精确度的各种应用中很有用(例如,建模树的高度)。
优点
缺点
所述确定的系数()在您试图了解所选自变量对因变量的变异性的理解程度时非常有用。当您试图解释哪些因素可能在推动潜在的关注过程(例如,与树木高度相关的气候变量和土壤条件)时,这很有用。
优点
缺点
当然,以上内容取决于样本量和样本设计,并且一般理解为相关并不意味着因果关系。
Actually,for statistical scientists should know the best fit of the model,then RMSE is very important for those people in his robust research.if RMSE is very close to zero,then the model is best fitted.
确定系数对农业和其他领域的其他科学家来说是好的。它是介于0和1之间的值。如果为1,则100%的值与观察到的数据集匹配。如果为0,则数据完全异质。印度泰米尔纳德邦韦洛尔VIT大学SK.Khadar Babu博士
如果向其中一个向量的每个元素添加一些数字,则RMSE会更改。如果一个或两个向量中的所有元素都乘以一个数字,则相同。R代码如下;
#RMSE vs pearson's correlation
one<-rnorm(100)
two<-one+rnorm(100)
rumis<-(two - one)^2
(RMSE<-sqrt(mean(rumis)))
cor(one,two)
oneA<-one+100
rumis<-(two - oneA)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneA,two)
oneB<-one*10
twoB<-two*10
rumis<-(twoB - oneB)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneB,twoB)
cor(oneB,twoB)^2
Ultimately the difference is just standardization as both lead to the choice of the same model, because RMSE times the number of observations is in the numerator or R squared, and the denominator of the latter is constant across all models (just plot one measure against the other for 10 different models).
This value shows how well future outcomes can be predicted by the model
-这是极易引起误解的,倾向于纯粹的错误。无法保证给定模型中的高确定性系数与未来结果的预测程度有关。