值与值列表相比有多重要?在大多数情况下,统计测试涉及将样本集与总体进行比较。在我的情况下,样本是由一个值构成的,我们将其与总体进行比较。
我是统计假设检验中的最重要人物,可能面临最基本的问题。这不仅是一项测试,而且包括数百项测试。我有一个参数空间,并且必须对每个点进行显着性检验。将为每个参数组合生成值和背景列表(填充)。然后按p值对它进行排序,并找到有趣的参数组合。实际上,找到此p值高(无意义)的参数组合也很重要。
因此,让我们进行一个测试:我有一个从选定的集合生成的计算值和一个通过选择随机训练集计算的背景值。计算值是0.35,背景集(可能是?)正态分布,平均值为0.25,且std非常窄(e-7)。我实际上对分布情况一无所知,因为样本是通过其他方式计算得出的,它们不是某种分布中的随机数样本,因此背景是正确的词。
零假设是“样本检验的平均值等于我的计算值0.35”。我什么时候应该将其视为Z检验或T检验?我希望该值显着高于总体平均值,因此这是单尾检验。
对于样本应考虑的内容,我有点困惑:我要么拥有一个样本(观测值),而且将背景列表作为总体,要么我的样本是背景列表,并且我将其与整体(未抽样)进行比较根据原假设的总体应该具有相同的均值。一旦决定,我猜测试会朝不同的方向发展。
如果是T检验,如何计算其p值?我想自己计算而不是使用R / Python / Excel函数(我已经知道该怎么做),因此我必须首先建立正确的公式。
- 如何计算p值?(即不使用R / Python / Excel函数或p值表查找,而是根据公式实际计算它,因为我想知道自己在做什么)
- 如何根据样本量确定显着性阈值?(一个公式会很好)