我目前正在努力实现一种流行的论文中使用的方法,该论文的标题为“ I Just Ran 200万Regressions”。其背后的基本思想是,在某些情况下,不清楚应在模型中包括哪些控件。在这种情况下,您可以做的一件事是随机绘制控件,运行数百万种不同的回归,然后查看您感兴趣的变量如何反应。如果它在所有规范中通常都具有相同的符号,那么我们可以认为它比符号总是变化的变量更可靠。
大部分论文非常清楚。但是,本文通过以下方式对所有这些不同的回归进行加权:给定规范的综合可能性除以所有规范的所有综合可能性之和。
我遇到的麻烦是,我不确定积分的可能性与我想运行的OLS回归(在Stata中)如何相关。在我不断碰到诸如混合效应逻辑回归之类的问题时,诸如“状态综合可能性”之类的谷歌搜索主题一直是死胡同。我承认这些模型太复杂了,我无法掌握。
我目前的工作是,我确实(有点)理解文献中使用了不同的加权方案。例如,可以基于似然比指数对每个回归进行加权。甚至有一个使用lri作为权重的R包。当然,我也想实施原始版本。
有什么建议吗?
论文链接:http : //down.cenet.org.cn/upfile/34/2009112141315178.pdf
1
该线程可以解决一些您的关注... stats.stackexchange.com/questions/215154/...
—
迈克·亨特
我曾经写过MATLAB中的函数复制萨拉-伊-马丁的结果(其中,顺便说一句,是不是真的在本领域模型选择的状态),见dropbox.com/s/mqa7qvhn7w5pkag/...。集成似然度(不确定您确切指的是什么)可能只是指数对数似然。
—
克里斯多夫·汉克
谢谢!我指的是第179页的等式4。它指出“权重与(综合)似然成正比”
—
NikolaiB,2016年