统计检验值远非总体平均值:Z检验还是T检验?


12

值与值列表相比有多重要?在大多数情况下,统计测试涉及将样本集与总体进行比较。在我的情况下,样本是由一个值构成的,我们将其与总体进行比较。

我是统计假设检验中的最重要人物,可能面临最基本的问题。这不仅是一项测试,而且包括数百项测试。我有一个参数空间,并且必须对每个点进行显着性检验。将为每个参数组合生成值和背景列表(填充)。然后按p值对它进行排序,并找到有趣的参数组合。实际上,找到此p值高(无意义)的参数组合也很重要。

因此,让我们进行一个测试:我有一个从选定的集合生成的计算值和一个通过选择随机训练集计算的背景值。计算值是0.35,背景集(可能是?)正态分布,平均值为0.25,且std非常窄(e-7)。我实际上对分布情况一无所知,因为样本是通过其他方式计算得出的,它们不是某种分布中的随机数样本,因此背景是正确的词。

零假设是“样本检验的平均值等于我的计算值0.35”。我什么时候应该将其视为Z检验或T检验?我希望该值显着高于总体平均值,因此这是单尾检验。

对于样本应考虑的内容,我有点困惑:我要么拥有一个样本(观测值),而且将背景列表作为总体,要么我的样本是背景列表,并且我将其与整体(未抽样)进行比较根据原假设的总体应该具有相同的均值。一旦决定,我猜测试会朝不同的方向发展。

如果是T检验,如何计算其p值?我想自己计算而不是使用R / Python / Excel函数(我已经知道该怎么做),因此我必须首先建立正确的公式。

T=Z/s,
Z=X¯σn
s=σ^/σ
  1. 如何计算p值?(即不使用R / Python / Excel函数或p值表查找,而是根据公式实际计算它,因为我想知道自己在做什么)
  2. 如何根据样本量确定显着性阈值?(一个公式会很好)

3
1060.35=106×107+0.250.35

1
@grokkaine-这个问题提出了一些有趣的问题,并且似乎很有价值,但是如果您稍加编辑,请注意要非常精确,我会发现它更有价值。
rolando2'2

这不仅是一项测试,而且包括数百项测试。我有一个参数空间,并且必须对每个点进行显着性检验。将为每个参数组合生成值和背景列表(填充)。然后按p值对它进行排序,并找到有趣的参数组合。实际上,找到此p值高(无意义)的参数组合也很重要。我稍后会尝试编辑我的帖子。
grokkaine

Answers:


10

您提出了一个有趣的问题。首先,如果您的观察值为0.35,均值为0.25,标准偏差为1/10 ^ 7(这就是我解释您的e ^ -7位的方式),那么您实际上不需要进行任何假设测试练习。您的0.35观察值与0.25的平均值有很大不同,因为它将与平均值相差几千个标准差,并且可能与平均值相差数百万个标准差。

Z检验和t检验之间的差异主要是指样本量。对于小于120的样本,应使用t检验计算p值。如果样本数量大于该数量,则使用任何一个样本都不会产生太大差异。无论样本大小如何,都可以通过两种方式进行计算,并观察两次测试之间的差异是多么有趣。

至于自己计算,您可以通过将观测值与均值之差除以标准误差来计算t stat。标准误差是标准偏差除以样本大小的平方根。现在,您有了自己的t统计信息。要计算ap值,我认为除了在测试表中查找t值外,别无选择。如果您接受简单的Excel替代方法,则TDIST(t stat值,DF,1或2表示1或2个尾部p值)可以解决问题。若要使用Z计算ap值,则1尾检验的Excel公式为:(1-NORMSDIST(Z值)。Z值与t stat相同(或远离平均值的标准误差数)。

需要注意的是,那些假设检验的方法可能会因样本量而失真。换句话说,样本量越大,标准误差越小,所得的Z值或t stat越高,p值越低,统计意义也越高。作为此逻辑的捷径,大样本量将导致较高的统计意义。但是,与大样本量相关的高统计意义可能完全不重要。换句话说,统计学上重要的是一个数学短语。它不一定意味着有意义(根据Webster词典)。

为了摆脱这一庞大的样本量陷阱,统计学家已转向使用效应量方法。后者使用两次标准偏差而不是标准误差作为两个观测值之间统计距离的单位。有了这样的框架,样本量将不会影响您的统计意义。使用效果大小还会使您远离p值,而进入置信区间,这在普通英语中可能更有意义。


感谢您的回答,对于样本应考虑的内容,我有些困惑:我有一个样本(观察值)和背景列表作为总体,或者我的样本是背景列表,我正在将其与根据原假设,整个(未抽样)总体应具有相同的均值。一旦决定,我猜测试会朝不同的方向发展。
grokkaine 2012年

使用您拥有的所有观察值作为样本(无论您如何称呼)。并且,计算您的一个观测值与所定义的样本平均值之间的统计距离。计算样品的标准偏差和标准误差。并且,您的观察值与平均值的统计距离为:(观察值-平均值)/标准误差= t stat。使用Excel TDIST函数(DF,t stat,1(代表一条尾巴)),您将获得p值。
Sympa '02

5

假设检验始终是指总体。如果您想对样本做出说明,则无需进行测试(只需比较您所看到的内容)。经常有人相信渐近,因此只要您的样本量很大,就不必担心数据的分布。Z检验和T检验在计算检验统计量方面基本上相同,只是从不同的分布(正态与学生T)获得临界值。如果样本量很大,则差异很小。

关于Q1:只需从具有n-1个自由度的T分布中查找即可,其中n是样本大小。

关于Q2:对于Z检验,您可以根据所需的显着性水平来计算阈值;对于T检验,则可以根据样本量的显着性水平来计算阈值。

但认真的说,您应该复习一些基本知识。


谢谢你的回答。实际上,我使用的是t-dist,但我也想了解“为什么”使用它。您如何定义“大”样本以及p值有何不同。更重要的是,我们如何知道正态分布或学生t分布?有统计检验吗?也许第二次使用kolmogorov-smirnov测试,第一次使用hmm ..什么?
grokkaine 2012年

2
Z ...和t从n = 60开始收敛。只需比较两个测试中得到的p值即可。t /正态分布假设不取决于基础数据的分布。基于这样的假设,均值的采样分布是正态的。即使您正在测试的变量是分布式Gamma,它仍然成立。在n = 200左右时,它应该可以正常工作。同样,所有这些东西都是基于常客统计。
joint_p 2012年

+1对假设检验总是指的人口,但-1似乎错过了提问者1的样本点的注释
彼得·埃利斯

1
我不太确定“我有一个计算值和一组随机生成的值的背景。计算值是0.35”是什么意思……我认为这暗示着有多个观察值。
joint_p 2012年

在其他段落中重新发表我的评论:关于样本的考虑方式,我有些困惑:我要么拥有一个样本(观察值),另一方面将背景列表作为总体,或者我的样本是背景列表,我将其与整个(未抽样的)总体进行比较,根据零假设,该总体均值应相同。一旦决定,我猜测试会朝不同的方向发展。
grokkaine
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.