95%的数字与您对自己已经涵盖了实验中的真实效果的信心没有任何数字联系。也许认识到“使用95%覆盖范围计算的间隔”可能是一个更准确的名称。您可以选择确定间隔包含真实值;如果您始终坚持95%的时间这样做,那将是对的。但是,如果没有更多信息,您真的不知道特定实验的可能性如何。
问题1:
您的第一个查询将两件事混为一谈,并且误用了一个术语。难怪你很困惑。较窄的置信区间可能更精确,但以相同的方式(例如95%方法)计算时,它们的准确性都相同。它们以相同的比例捕获真实值。
而且,仅因为它的范围狭窄并不意味着您不太可能遇到落入该狭窄置信区间内的样本。可以通过以下三种方式之一实现较窄的置信区间。实验方法或数据的性质可能具有非常低的差异。无论样本大小如何,海平面上自来水沸点周围的置信区间都非常小。围绕人的平均体重的置信区间可能会很大,因为人的变化很大,但是只要获取更多的观察值,就可以减小该置信区间。在这种情况下,通过确定更多的样本并缩小置信区间,您可以更加确定自己相信真实值在哪里,那么在该置信区间内遇到一个人的可能性确实下降了。(在增加样本量的情况下,它都会减小,但是您可能不必费心在沸水箱中收集大样本)。最后,它可能很狭窄,因为您的样本没有代表性。在这种情况下,您实际上更有可能拥有不包含真实值的5%间隔之一。关于CI宽度,这有点自相矛盾,您应该通过了解文献以及该数据通常具有多大的可变性来进行检查。在这种情况下,您实际上更有可能拥有不包含真实值的5%间隔之一。关于CI宽度,这有点自相矛盾,您应该通过了解文献以及该数据通常具有多大的可变性来进行检查。在这种情况下,您实际上更有可能拥有不包含真实值的5%间隔之一。关于CI宽度,这有点自相矛盾,您应该通过了解文献以及该数据通常具有多大的可变性来进行检查。
进一步考虑置信区间是要尝试估计总体的真实平均值。如果您知道该点,那么您将更加准确(而且准确),甚至没有一系列的估计值。但是,您遇到具有相同精确值的观测值的可能性远低于在任何基于特定样本的CI中找到观测值的可能性。
问题2:99%的置信区间大于95%的置信区间。因此,它更有可能包含真实值。看到上面的精确与准确之间的区别,您将两者混为一谈。如果我用较低的变异性和较大的样本量使置信区间变窄,它将变得更加精确,可能的值将覆盖较小的范围。如果我通过使用99%的计算来增加覆盖率,它将变得更加准确,则真实值很可能在该范围内。