我已经正态分布从中我得到小样本(进程ñ通常为10-30),我想用估计方差。但是,这些样本之间的距离常常如此之近,以至于我们无法测量中心附近的各个点。
我有一个模糊的理解,我们应该能够使用有序样本构建一个有效的估算器:例如,如果我知道样本包含20个点,并且10个点过于靠近中心而无法单独进行测量,但是我有离散的测量值尾巴上是否有5个,是否有一种标准/公式化的方法来估算最佳利用此类样本的过程差异?
(请注意,我认为我不能加权中心平均值。例如,可能有7个样本紧密聚类,而另外3个样本不对称地偏向一侧,但足够接近,如果没有更繁琐的单次抽样,我们就无法断定)
如果答案很复杂,那么我应该研究的任何技巧都将不胜感激。例如,这是一个订单统计问题吗?可能会有一个公式化的答案,或者这是一个计算问题?
更新的详细信息:该应用程序是对射击目标的分析。单个基础样本是单个镜头对目标的影响点(x,y)。基本过程具有对称的双变量正态分布,但轴之间没有相关性,因此我们能够将{ x }和{ y }样本视为来自相同正态分布的独立绘制。(我们也可以说底层过程是瑞利分布的,但是我们无法测量样本瑞利变量,因为我们无法确定过程的“真实”中心的坐标,对于小n来说,这可以是显着的远离样品中心(,))。
给我们一个目标和射入其中的镜头数量。问题在于,对于n >> 3支精确的枪,通常会发射出一个“参差不齐的孔”,周围是不同的射击。我们可以观察到孔的x-和y-宽度,但是我们不知道未区分的镜头在孔中的哪个位置受到了影响。
以下是一些有问题的目标的示例:
(当然,在理想情况下,我们会在每次拍摄后更改/切换目标,然后汇总样本进行分析。尽管有可能,但有很多原因通常是不切实际的。)
注释中经过WHuber澄清后的其他说明:子弹产生的目标孔直径均匀且已知。当射击不在任何“参差不齐的群”之外时,我们知道了射弹半径,因此我们可以测量精确的中心。在每个“参差不齐的组”中,我们可以识别出一定数量的外围“球”,并根据已知的射弹半径再次标记这些外部射击的精确中心。这是剩下的 “中心审查”的镜头,我们只知道影响地方的“破烂组”的内部(通常是-如果有必要,让我们假设-一个目标一个)。
为了简化求解,我相信将其最简单地从法线简化为一组一维样本,其中心间隔为w > d,其中d为弹丸直径,包含c < n个 “被检举”样本。