我想计算一个p值,以在显着性水平αiff p <α时拒绝H0;证明我的人口呈正态分布。
当数据由一系列附加的iid事件生成时,将出现正态分布(请参见下面的梅花形图像)。这意味着没有反馈,也没有相关性,听起来像是引导数据的过程吗?如果没有,那可能不正常。
在您的情况下,很可能会发生某种类型的过程。最接近“证明”的地方是收集足够的数据以排除人们可以想到的任何其他分布(这可能是不实际的)。另一种方法是从某些理论和其他预测推论出正态分布。如果数据与所有数据都一致,并且没人能想到另一种解释,那么这将是支持正态分布的良好证据。
https://en.wikipedia.org/wiki/Bean_machine
现在,如果您不期望任何特定的分布,可以使用正态分布来汇总数据仍然是合理的,但是请注意,这本质上是出于无知的选择(https://en.wikipedia.org/wiki/ Principle_of_maximum_entropy)。在这种情况下,您不想知道总体是否为正态分布,而是想知道对于下一步将要满足的情况,正态分布是否是合理的近似值。
在这种情况下,您应该提供您的数据(或类似的生成数据)以及您打算如何处理的描述,然后问“在这种情况下假设正常性会以什么方式误导我?”