我有一个一般的方法论问题。之前可能已经回答过,但是我无法找到相关的线程。我将感谢可能重复的指针。
(这是一个很好的答案,但是没有答案。即使在回答时,这在精神上也很相似,但是从我的角度来看,后者太具体了。这也很贴切,在发布问题后才发现。)
主题是,当看到数据之前制定的模型未能充分描述数据生成过程时,如何进行有效的统计推断。这个问题很笼统,但是我将提供一个特定的例子来说明这一点。但是,我希望答案会集中在一般的方法论问题上,而不是挑剔特定示例的细节。
考虑一个具体的示例:在时间序列设置中,我假设数据生成过程为 其中。我的目标是检验的主题假设。我根据模型以获得与我的主题假设相对应的可行的统计对应关系,即 到目前为止,一切都很好。但是,当我观察数据时,我发现该模型无法充分描述数据。假设存在线性趋势,因此真实数据生成过程为 其中
如何对主题假设进行有效的统计推断?
如果我使用原始模型,则会违反其假设,并且的估计量不会具有否则会好的分布。因此,我无法使用检验检验假设。
如果查看数据后,我从模型切换到,并将我的统计假设从更改为,则满足模型假设,我得到一个表现良好的估计量,并且可以使用轻松测试。 但是,从切换到
可以从我要检验假设的数据集中获悉。这使得估算器分布(以及推断也)取决于基础模型的变化,这是由于观察到的数据所致。显然,引入这种条件并不令人满意。
有没有好的出路?(如果不是常客,那么也许是一些贝叶斯替代方法?)