我正在尝试通过抽样估计高斯分布的均值。我尚无关于其均值或方差的知识。每个样品的获取都很昂贵。如何动态确定要获得一定水平的置信度/准确性所需的样本数量?另外,我如何知道何时可以停止采样?
我能找到的所有类似问题的答案似乎都是对方差的一些了解,但我也需要一路发现这一点。其他人则适合进行民意调查,但我(初学者是我)还不清楚这种说法的普遍性-我的意思不是[[0,1]等)。
我认为这可能是一个答案很简单的简单问题,但是我的Google-fu令我失望。即使只是告诉我要搜索的内容也会很有帮助。
您为何将其标记为CW?这个问题似乎足够具体,可以提供一个正确的答案,因此不应该是CW。
Google的“自适应采样”和“顺序采样”。如果您仍然感到困惑,可以使用“ Wald”作为关键字,然后进行历史改进(例如,查看引用Wald的有关顺序采样的论文,然后查看引用它们的论文,等等)。
—
ub
@Robby McKilliam:但是您使用什么数据?在收集任何数据之前就出现了这个问题。如果您一次收集一个值并在将每个新值添加到数据集之后计算CI,则由于要进行相关的多次比较,因此无法使用标准公式作为间隔。因此,您需要一个停止规则,以优化估算器的统计风险之和与收集每个其他样本的成本之和。
—
ub
@whuber谢谢!我仍在消化这些资料,但是我认为这正是我想要的。如果这是答案,我会接受...
—
Josh Bleecher Snyder