改进最小估计量


9

假设我有正参数来估计以及由估计器产生的相应的无偏估计,即,等。n^ μ 1^ μ 2^ μ Ñ ë [ ^ μ 1 ] = μ 1个Ë [ ^ μ 2 ] = μ 2μ1,μ2,...,μnnμ1^,μ2^,...,μn^E[μ1^]=μ1E[μ2^]=μ2

我想使用手头的估算来估算。显然,幼稚估计被偏置为低 min(μ1,μ2,...,μn)min(μ1^,μ2^,...,μn^)

E[min(μ1^,μ2^,...,μn^)]min(μ1,μ2,...,μn)

假设我还拥有相应估计量的协方差矩阵。是否有可能使用给定的估计值和协方差矩阵来获得最小的无偏(或偏少偏见)估计?Cov(μ1^,μ2^,...,μn^)=Σ


您愿意使用贝叶斯MCMC方法还是需要一些封闭式公式?
马丁·莫德拉克(MartinModrák)'18年

但是简单的采样方法可以吗?(同样,您严格不需要贝叶斯分析的先验知识,但这是另一个故事)
MartinModrák18年

@MartinModrák我没有采样方法的经验。如果我做贝叶斯,我通常会做简单的共轭东西。但是,如果您认为这是要走的路,我会继续学习。
Cagdas Ozgenc

您对这些估计还了解什么?你知道表情吗?您知道用于估算这些参数的数据分布吗?
wij

@wij如果需要,我可以尝试估算估计量的其他时刻。对于估计量的分布,我没有解析表达式。解决方案不应(作为我的要求)取决于数据本身的分布。
Cagdas Ozgenc

Answers:


4

对于无偏估计量的存在,我没有明确的答案。但是,就估计误差而言,估计通常是一个内在的难题。min(μ1,,μn)

例如,让和。让是目标量和是的估计。如果我们使用“天真”估计量,其中,则估计误差由 直到恒定。(注意,对于每个估计误差就是)。当然,如果μ = μ 1... μ Ñθ = 分钟μ θ θ θ = 分钟ˉ Ý‾ ÿ = 1个Y1,,YNN(μ,σ2I)μ=(μ1,,μn)θ=miniμiθ^θθ^=mini(Y¯i)大号2ë[ θ -θ]2σ2日志ÑYi¯=1Nj=1NYi,jL2 μσ2

E[θ^θ]2σ2lognN
μi μσ2Nμi彼此相距遥远并且非常小,估计误差应减小为 。但是,在最坏的情况下,没有的估计比天真的估计更好。您可以精确地显示 ,其中最小值基于样本接管的所有可能估计接管的所有可能配置。σ 2σ θINF θ SUP μ 1... μ Ñ ë[ θ -θ]2σ2日志Ñσ2Nθ θÿ1...ÿÑμ
infθ^supμ1,,μnE[θ^θ]2σ2lognN
θY1,,YNμi

因此,朴素的估计量在不超过常数的情况下是minimax最优的,在这个意义上没有更好的估计量。θ


提供的其他信息根本没有帮助吗?哪些其他统计信息可能会有所帮助?
Cagdas Ozgenc

很抱歉提出一个混乱的观点。我并不是说其他​​信息(协方差)没有帮助。我只是想指出,估计至少有几种人口均数在本质上是困难的。协方差信息应该会有所帮助。例如,在正常情况下,如果我们对所有可能的对都具有完美的相关性,则意味着随机观测值来自不同的均值+一个公共的噪声项。在这种情况下,天真估计量(样本均值的最小值)是无偏的。
JaeHyeok Shin

3

编辑:以下回答的问题与所询问的问题不同—它被视为好像被认为是随机的,但在被认为是固定的时不起作用,这可能是OP的初衷。如果是固定的,那么我没有比更好的答案μ μ 分钟μ 1μ Ñμμμmin(μ^1,...,μ^n)


如果仅考虑均值和协方差的估计值,则可以将视为来自多元正态分布的单个样本。一种简单的估计最小值的方法是从中提取大量样本,计算每个样本的最小值,然后取这些最小值的平均值。中号V Ñ μΣ (μ1,...,μn)MVN(μ^,Σ)

以上过程及其局限性可以用贝叶斯术语来理解-以Wikipedia上的MVN表示,如果是估计量的已知协方差,并且我们有一个观察结果,则联合后验分布为其中和来自先验,在观察任何数据之前,我们先取先验)。由于您可能不愿意在上放置先验,我们可以将限制取为,从而导致平坦的先验,后验变为μ 中号V Ñ μ + λ 0Σλ0μ中号VÑλ0-1Σμ0μ中号VÑ μΣμμMVN(μ^+mλ01+m,1n+mΣ)λ0mμMVN(λ0,m1Σμm0μMVN(μ^,Σ)。但是,在给定平坦先验的情况下,我们隐含地假设的元素相差很大(如果所有实数的可能性均等,则很难获得相似的值)。μ

快速模拟表明,此过程稍稍高估的估计时的元素差别很大和低估当元件是类似的。有人可能会说,没有任何先验知识,这就是正确的行为。如果您愿意陈述至少一些先验信息(例如),则对于您的用例,结果可能会表现得更好。μ 中号Ñ μ = 0.1min(μ)μmin(μ)m=0.1

如果您愿意采用更多的结构,则可以选择比多元正态分布更好的分布。首先,也可以使用Stan或其他MCMC采样器来拟合的估计。这将为您提供一组样本,这些样本反映了估计量本身的不确定性,包括其协方差结构(可能比MVN所提供的丰富)。再一次,您可以计算每个样本的最小值,以获得最小值的后验分布,如果需要点估计,则取该分布的均值。μ 1μ Ñμ(μ1,...,μn)


请注意,我没有尝试估计N个随机变量的最小值。我正在尝试估计N个参数的最小值。看来您的建议是对的估计,而我需要对E[min(μ1^,μ2^,...,μn^)]min(μ1,μ2,...,μn)
Cagdas Ozgenc

我试图编辑答案以解释基本原理,希望能对您有所帮助。
马丁·莫德拉克(MartinModrák)'18年

因此,这是抽样的方法产生更好的效果比较简单估计,这也效果很好,当远分开并且低估了它们何时接近。为了使它有用,它应该在关闭时起作用。min(μ1^,μ2^,...,μn^)μi
Cagdas Ozgenc

还要注意,所有都是正数,因此您实际上并不需要实线的负数。μi
Cagdas Ozgenc

1
您是正确的,我忽略了这些迹象,也没有找到一种适应这些迹象的简单方法。同样,当将视为随机变量时,我提出的估计器的性能也会更好,但对于固定的,它的效果要比。我认为我无法挽救这个问题,而且我不确定前进的最佳方法是什么-我倾向于删除答案,因为它并不能真正回答问题,但是(我希望)答案也包含一些想法,可能对某人有用。中号Ñ μμμmin(μ^)μ
马丁·莫德拉克(MartinModrák)'18年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.