我正在研究一个高维推理问题(大约2000个模型参数),通过结合基于梯度的优化和遗传算法,可以找到对数后验的全局最大值,从而能够稳健地执行MAP估计。
除了找到MAP估计值外,我非常希望能够对模型参数的不确定性做出一些估计。
我们能够有效地计算相对于参数的对数后验的梯度,因此长期而言,我们的目标是使用哈密顿量MCMC进行一些抽样,但是现在我对基于非抽样的估计感兴趣。
我知道的唯一方法是在该模式下计算Hessian的逆值,以近似于多元多元法线的后验,但即使对于这样的大型系统,这似乎也不可行,因为即使我们计算出元素粗麻布我敢肯定我们找不到它的逆。
谁能建议在这种情况下通常使用哪种方法?
谢谢!
编辑 -有关该问题的其他信息
背景技术
这是一个与大型物理实验有关的反问题。我们有一个2D三角形网格,描述了一些物理场,我们的模型参数是这些场在网格每个顶点处的物理值。网格具有大约650个顶点,我们对3个字段进行了建模,因此这就是我们2000个模型参数的来源。
我们的实验数据来自不能直接测量这些场的仪器,而是来自那些复杂的非线性函数的量。对于每种不同的仪器,我们都有一个正向模型,该模型将模型参数映射到实验数据的预测,并且将预测与测量值进行比较可得出对数似然。
然后,我们总结来自所有这些不同工具的对数似然率,并添加一些对数优先级值,这些值将某些物理约束应用于字段。
因此,我怀疑这个“模型”是否整齐地归为一类-我们无法选择模型是什么,它取决于实际仪器如何收集我们的实验数据。
数据集
数据集由500x500张图像组成,每个摄像机只有一张图像,因此总数据点为500x500x4 = 。
错误模型目前,
我们将问题中的所有错误都设为高斯。在某些时候,我可能会尝试移至Student-t错误模型,只是为了获得更大的灵活性,但是对于高斯人来说,事情似乎仍然运作良好。
可能性示例
这是一个等离子物理实验,我们的大部分数据来自指向等离子的相机,镜头前有特定的滤光片,只能观察光谱的特定部分。
要重现数据,有两个步骤;首先,我们必须对来自网格上等离子的光进行建模,然后我们必须对该光进行建模,使其返回相机图像。
不幸的是,对来自等离子体的光进行建模取决于有效的速率系数,即在给定电场的情况下,不同过程发出多少光。这些速率是由一些昂贵的数值模型预测的,因此我们必须将它们的输出存储在网格中,然后进行插值以查找值。费率函数数据仅计算一次-我们将其存储,然后在代码启动时从中构建一个样条,然后将该样条用于所有函数评估。
假设和是速率函数(我们通过插值法对其求值),则网格E i的第个顶点的发射由
E i = R 1(x i,y i)+ z i给出R 2(x i,y i)
其中(x ,y ,z )
由于误差是高斯型,因此该特定摄像机的对数似然为
其中是摄像机数据。总对数似然是上述表达式中的4个的总和,但对于不同的相机,由于它们查看的是光谱的不同部分,所以它们的速率函数不同。
先验示例
我们拥有各种先验,这些先验实际上只是为各种数量设置了一定的上限和下限,但是它们往往不会对问题产生太大的作用。我们确实有一个先例,其作用很强,可以有效地将拉普拉斯型平滑应用于场。它还采用高斯形式: