Questions tagged «model-averaging»


2
这是最先进的回归方法吗?
我一直关注Kaggle比赛很久了,后来我意识到许多获胜策略涉及至少使用“三巨头”之一:装袋,助推和堆叠。 对于回归,而不是专注于建立一个可能的最佳回归模型,而是建立多个回归模型,例如(广义)线性回归,随机森林,KNN,NN和SVM回归模型,并以合理的方式将结果融合为一个-多次执行每种方法。 当然,对每种方法的扎实理解是关键,并且可以基于线性回归模型讲述直观的故事,但是我想知道这是否已成为最先进的方法论,以便获得最佳结果。

7
结合不同来源的概率/信息
可以说我有三个独立的消息源,每个消息源都对明天的天气做出了预测。第一个说明天下雨的概率是0,第二个说明天下雨的概率是1,最后一个说明天下雨的概率是50%。我想知道给出该信息的总概率。 如果将乘法定理应用于独立事件,我将得到0,这似乎是不正确的。如果所有来源都是独立的,为什么不能将这三个数相乘?当我获得新信息时,是否有贝叶斯方法来更新先验信息? 注意:这不是作业,是我一直在考虑的事情。

1
对于模型平均GLM,我们是否将链接或响应规模上的预测平均?
要计算GLM响应规模上模型平均的预测,这是“正确的”,为什么? 在链接规模上计算模型平均预测,然后反变换为响应规模,或者 将预测反向转换为响应尺度,然后计算模型平均值 如果模型是GLM,则预测接近但不相等。不同的R包为这两者提供了选项(具有不同的默认值)。几位同事大声疾呼:#1错误是因为“每个人都#2”。我的直觉说#1是“正确的”,因为它使所有线性数学保持线性(#2对不在线性范围内的事物进行平均)。一个简单的仿真发现,#2的MSE比(#1)小(非常!)。如果#2是正确的,那是什么原因?而且,如果#2是正确的,为什么我的原因(保持线性数学线性)的推理能力很差? 编辑1:在GLM中计算超出另一个因素水平的边际均值与我在上面提出的问题类似。Russell Lenth使用#1(在emmeans软件包中)的“时间”(他的话)来计算GLM模型的边际均值,他的论点与我的直觉相似。 编辑2:我使用模型平均来指代模型选择的替代方法,其中将预测(或系数)估计为“最佳”嵌套模型的全部或子集的加权平均值(请参见下面的参考资料和R包) 。 鉴于嵌套模型,其中为个别的线性预测(在链路空间)为模型,和为模型的重量,使用#1的上方(平均链路上的模型的平均预测规模,然后反向转换为响应规模)是:MMMηmiηim\eta_i^miiimmmwmwmw_mmmm Y^i=g−1(∑m=1Mwmηmi)Y^i=g−1(∑m=1Mwmηim)\hat{Y}_i = g^{-1}\Big(\sum_{m=1}^M{w_m \eta_i^m}\Big) 并且使用上述#2进行模型平均的预测(对所有预测进行反变换,然后在响应尺度上取平均值)是:MMM Y^i=∑m=1Mwmg−1(ηmi)Y^i=∑m=1Mwmg−1(ηim)\hat{Y}_i = \sum_{m=1}^M{w_m g^{-1}(\eta_i^m}) 模型平均的一些贝叶斯和惯常方法是: Hoeting,JA,Madigan,D.,Raftery,AE和Volinsky,CT,1999。贝叶斯模型平均:教程。统计科学,第382-401页。 Burnham,KP和Anderson,DR,2003年。模型选择和多模型推断:一种实用的信息理论方法。施普林格科学与商业媒体。 汉森,比利时,2007年。最小二乘模型平均。计量经济学,75(4),1175-1189页。 Claeskens,G。和Hjort,NL,2008年。模型选择和模型平均。剑桥图书。 R软件包包括BMA,MuMIn,BAS和AICcmodavg。(注意:这不是更普遍的模型平均智慧的问题。)

2
在R中解释模型平均结果
我正在尝试了解和知道使用R中的模型平均对某些数据进行分析所报告的内容。 我正在使用以下脚本来分析给定变量的测量方法的效果:这是数据集:https : //www.dropbox.com/s/u9un273gzw9o30u/VMT4.csv?dl=0 适用车型: LM.1 <- gls(VMTf ~ turn+sex+method, na.action="na.fail", method = "ML",VMT4) 挖泥船全模型 require(MuMIn) d=dredge(LM.1) print(d) coefficients(d) 获取所有模型的摘要信息以获取参数估计 summary(model.avg(d)) 我知道可以对所有模型进行平均(完整模型平均),也可以对其中一部分进行条件平均。现在,我想知道:什么时候最好使用完全或条件平均进行推断。对于科学文章,我应该报告所有这些内容吗?对于模型平均情况,Z值和关联的p到底意味着什么? 为了使可视化我的问题更加容易。这是结果表, > summary(model.avg(d))# now, there are effects Call: model.avg(object = d) Component model call: gls(model = VMT ~ <8 unique rhs>, data = VMT4, method = ML, na.action …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.