估计中心删失正态样本的方差


11

我已经正态分布从中我得到小样本(进程ñ通常为10-30),我想用估计方差。但是,这些样本之间的距离常常如此之近,以至于我们无法测量中心附近的各个点。

我有一个模糊的理解,我们应该能够使用有序样本构建一个有效的估算器:例如,如果我知道样本包含20个点,并且10个点过于靠近中心而无法单独进行测量,但是我有离散的测量值尾巴上是否有5个,是否有一种标准/公式化的方法来估算最佳利用此类样本的过程差异?

(请注意,我认为我不能加权中心平均值。例如,可能有7个样本紧密聚类,而另外3个样本不对称地偏向一侧,但足够接近,如果没有更繁琐的单次抽样,我们就无法断定)

如果答案很复杂,那么我应该研究的任何技巧都将不胜感激。例如,这是一个订单统计问题吗?可能会有一个公式化的答案,或者这是一个计算问题?

更新的详细信息:该应用程序是对射击目标的分析。单个基础样本是单个镜头对目标的影响点(x,y)。基本过程具有对称的双变量正态分布,但轴之间没有相关性,因此我们能够将{ x }和{ y }样本视为来自相同正态分布的独立绘制。(我们也可以说底层过程是瑞利分布的,但是我们无法测量样本瑞利变量,因为我们无法确定过程的“真实”中心的坐标,对于小n来说,这可以是显着的远离样品中心(,))。x¯y¯

给我们一个目标和射入其中的镜头数量。问题在于,对于n >> 3支精确的枪,通常会发射出一个“参差不齐的孔”,周围是不同的射击。我们可以观察到孔的x-y-宽度,但是我们不知道未区分的镜头在孔中的哪个位置受到了影响。

以下是一些有问题的目标的示例:

[n = 10的样本目标]

n = 100的样本目标

(当然,在理想情况下,我们会在每次拍摄后更改/切换目标,然后汇总样本进行分析。尽管有可能有很多原因通常是不切实际的。)

注释中经过WHuber澄清后的其他说明:子弹产生的目标孔直径均匀且已知。当射击不在任何“参差不齐的群”之外时,我们知道了射弹半径,因此我们可以测量精确的中心。在每个“参差不齐的组”中,我们可以识别出一定数量的外围“球”,并根据已知的射弹半径再次标记这些外部射击的精确中心。这是剩下的 “中心审查”的镜头,我们只知道影响地方的“破烂组”的内部(通常是-如果有必要,让我们假设-一个目标一个)。xi

为了简化求解,我相信将其最简单地从法线简化为一组一维样本,其中心间隔为w > d,其中d为弹丸直径,包含c < n个 “被检举”样本。


(1)正态分布是假设还是您有充分的证据支持该假设?(2)是否存在无法准确计算中心附近的数据的问题?(这与“检查”的通常含义不同,后者可以计算这些数据,但仅知道它们的值在一定的间隔内。)
whuber

@whuber:是的,我们有基本的和经验的证据,表明这一过程是正态分布的。是的,我们知道确切的点的总组中,我们可以观察到的时间间隔(一个或多个),其中太多的样本骗来确定各个值。
footwet 2013年

谢谢,这很有帮助。不过,不确定性的性质仍然不清楚,因此,建立一个好的模型可以激发一个好的解决方案。您能否提供一个说明或示例,或者至少更详细地描述测量过程?
ub

@whuber:已更新。如果有帮助,我还将努力发布一些实际示例的链接。
footwet

X一世μσ2σ一世X一世[R[RX[R[RX

Answers:


2

那是一个有趣的问题。首先,我不会假设正态分布。看来,您真正要寻找的是一些估计的色散,您可以将该色散合理地应用于许多不同的射手,枪支或弹药等。

我会尽力解决这个问题。除非看到10个单独的洞(假设有10发子弹),否则您不知道所有子弹的确切位置。但是您知道他们没有去哪里。如果要从分布开始,可以使用贝叶斯统计量来限制分布。

在这里最好的想法是停止尝试以数学方式进行操作,而只是做一些明智的操作。对准目标并运行图像处理例程,以标记可能未连接的穿透区域。测量其平均值和第二矩,并使用它们作为估计量。如果您想进一步尝试将其高斯化,可以运行简单的蒙特卡洛实验以获得校准系数。


让我解释一下。假设您有10发子弹,并且有6个清晰的孔,您可以知道子弹的去向。首先考虑这些点,并用它们来约束高斯宽度。按照通常的程序,这限制了高斯西格玛的
murphyk/Papers/

现在,一旦完成此操作,就需要考虑没有产生新漏洞的4个项目符号。由于子弹是独立的,因此可以简单地乘以这种新的可能性(在高斯sigma上)。因此,基本上,对于这4种子弹,您都希望乘以它们不会产生新洞的概率。
Dave31415 2014年

使用monte carlo进行此操作的一种简单方法是从受约束的分布中绘制一组sigma,并使用该sigma来计算不打新孔的机会。因此,从中绘制许多模拟镜头并计算出哪些分数不会造成新的漏洞。然后可以将其用于更新可能性。然后继续进行下一个操作。现在,您拥有最终的可能性。
Dave31415 2014年

最后评论。从实际的角度来看,只要您假设未通过的子弹穿过先前的孔,对sigma的估计值的影响就不会受到太大影响。大部分情况下,您会看到定义边缘的约束。这是因为子弹两次穿过远离中心的孔的几率很小。因此,即使是粗糙的蒙特卡洛也会使您非常接近最佳估计量。
Dave31415 2014年

如果我们不主张正态分布(或其他分布),那么除了要对被检查区域的状况进行上限或下限之外,我们似乎无话可说。在一维情况下,我们检查了n个镜头,方差的下限是假设它们都击中了最接近均值的同​​一内部点,并且(假设均值位于内部中心),上限是假设检查点在内部外围均匀分布。但是,如果我们假设基础流程是正常的,则似乎我们应该能够做得更好。
footwet 2014年

0

从另一个角度来看,可以根据“空间统计”领域查看此信息,该领域创建了各种指标,其中许多指标已放置在工具箱中(例如,参见https://www.google.com。 / url吗

Wikipedia(链接:http//en.m.wikipedia.org/wiki/Spatial_descriptive_statistics)实际上有一个很好的介绍性页面,讨论了诸如空间中心趋势和空间分散性的度量等概念。在后者上引用维基百科:

“对于大多数应用,空间色散应以不旋转和反射不变的方式进行量化。可以使用点坐标的协方差矩阵来定义点集的几种简单的空间色散度量。迹线即行列式,协方差矩阵的最大特征值可以用作空间色散的度量。不基于协方差矩阵的空间色散的度量是最近邻居之间的平均距离。[1]“

相关概念包括空间同质性的度量,Ripley的K和L函数,并且可能与子弹群的分析最相关,库兹克-爱德华兹检验(Cuzick-Edwards测试)用于在聚类种群内对亚种群进行聚类。后者的测试基于与对照组的比较(使用“最近邻”分析来制表统计数据),在当前情况下,该对照组可以基于归类为不显示聚类的实际观察目标,或者根据理论模拟,从说瑞利分布。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.