这部分是由于以下问题及其后续讨论引起的。
假设观察到iid样本。目的是估计。但是原始样品不可用。相反,我们拥有的是样本一些统计信息。假设是固定的。我们如何估算?在这种情况下,最大似然估计器是什么?θ Ť 1,。。。,Ť ķ ķ θ
这部分是由于以下问题及其后续讨论引起的。
假设观察到iid样本。目的是估计。但是原始样品不可用。相反,我们拥有的是样本一些统计信息。假设是固定的。我们如何估算?在这种情况下,最大似然估计器是什么?θ Ť 1,。。。,Ť ķ ķ θ
Answers:
在这种情况下,您可以在以下假设/约束下考虑似然性的ABC近似值(并因此考虑MLE):
假设。原始样本大小是已知的。
考虑到频繁性估计量的收敛性取决于样本量,因此这不是一个疯狂的假设,因此,在不知道原始样本量的情况下,无法获得任意好的估计量。
这个想法是根据的后验分布生成一个样本,并且为了产生MLE的近似值,您可以使用[1]中的重要性抽样技术,或者考虑上的统一先验,并支持[2]中的合适集合。θ
我将在[2]中描述该方法。首先,让我描述一下ABC采样器。
ABC采样器
令为生成样本的模型,其中为参数(待估计),为统计量(样本的函数),为观察到的统计量在ABC行话这就是所谓的汇总统计,是一个度量,上的先验分布和的容差。然后,可以如下实现ABC拒绝采样器。θ ∈ Θ Ť Ť 0π (θ )θ ε > 0
该算法根据给定的的后验分布生成近似样本。因此,最好的情况是统计量足够但可以使用其他统计量。有关此内容的详细说明,请参见本文。Ť (X)= Ť 0 Ť
现在,在一个通用框架中,如果使用统一的先验,且先验包含MLE,则最大后验(MAP)与最大似然估计器(MLE)重合。因此,如果您在ABC采样器中考虑适当的先验先验,则可以生成后验分布的近似样本,其MAP与MLE一致。其余步骤包括估算此模式。这个问题已经在CV中讨论过,例如在“多元模式的计算有效估计”中。
一个玩具的例子
令为的样本并假定此样本中唯一可用的信息为。令为的欧几里得度量,。下述R代码示出了如何使用上述使用模拟样品与所描述的方法,以获得一个近似MLE和,大小的后验分布的样本,均匀先验上,以及用于估计后样本模式(MAP = MLE)的核密度估计器。Ñ (μ ,1 )ˉ X = 1ρřε=0.001Ñ=100μ=01000μ(-0.3,0.3)
rm(list=ls())
# Simulated data
set.seed(1)
x = rnorm(100)
# Observed statistic
T0=mean(x)
# ABC Sampler using a uniform prior
N=1000
eps = 0.001
ABCsamp = rep(0,N)
i=1
while(i<N+1){
u = runif(1,-0.3,0.3)
t.samp = rnorm(100,u,1)
Ts = mean(t.samp)
if(abs(Ts-T0)<eps){
ABCsamp[i]=u
i=i+1
print(i)
}
}
# Approximation of the MLE
kd = density(ABCsamp)
kd$x[which(kd$y==max(kd$y))]
如您所见,使用较小的公差,我们可以得到非常好的MLE近似值(在这个琐碎的示例中,只要有足够的统计量就可以计算得出)。重要的是要注意汇总统计的选择至关重要。分位数通常是汇总统计信息的不错选择,但并非所有选择都能产生良好的近似值。可能的情况是,摘要统计信息不是非常有用,因此近似值的质量可能很差,这在ABC社区中是众所周知的。
这完全取决于这些的联合分布是否已知。如果是,例如, (Ť 1,... ,Ť ķ)〜克(吨1,... ,吨ķ | θ ,Ñ ) 则可以进行基于此的联合分布的最大似然估计。请注意,除非(T 1,… ,T k)足够,否则与使用原始数据(
如果上述密度为关节分布不可用,则Procrastinator提出的解决方案是非常合适的。
(频率)最大似然估计器如下:
实际使可能性最大化的方式主要取决于能否以一种易于处理的方式分析性地写入可能性。如果可能的话,您将可以考虑一般的优化算法(newton-raphson,simplex ...)。如果您没有可预测的可能性,则可能会发现像EM算法中那样更容易计算条件期望,这在相当可承受的假设下也会产生最大似然估计。
最好