如果平均差异几乎为0,那么t检验在统计上如何显着?


10

我正在尝试比较2个人群的数据,以判断治疗之间的差异是否具有统计学意义。数据集看起来是正态分布的,两组之间的差异很小。平均差异为0.00017。我执行了配对t检验,期望我不会拒绝均值之间没有差异的零假设,但是,我计算出的t值要比临界t值高得多。


您想提出什么建议?你的N是什么?
gung-恢复莫妮卡

嗨,我只是不太确定该如何进行,如果我做错了什么,首先要看的是数据似乎根本没有什么不同。两组都有335个观测值
Kscicc26

5
均值差的标准误差也是标准差和样本量的函数。所有这些片段都需要您提出问题,然后才能记录任何惊奇。
Glen_b-恢复莫妮卡2014年

7
每个差异都是“几乎为0”!如果结果变量是人们增加的体重并以磅为单位,则0.00017确实很小,但是如果以百万磅为单位,则0.00017很大。因此,在提供上下文(响应中正在测量的内容)和度量单位之前,该问题才有意义。
ub

1
在更广泛的英语意义上,统计意义并不意味着“意义”。
david25272

Answers:


9

即使平均差异很小,我也没有理由相信您做错了什么仅仅是因为测试很重要。在配对t检验中,重要性将由三件事决定:

  1. 均值差的大小
  2. 您拥有的数据量
  3. 差异的标准偏差

诚然,您的平均差异非常小。另一方面,您确实有大量数据(N = 335)。最后一个因素是差异的标准偏差。我不知道那是什么,但是由于您得到了重要的结果,因此可以放心地假设它足够小,可以克服所拥有数据量的微小均值差异。为了建立直觉,假设您的研究中每个观察值的配对差异为0.00017,则差异的标准偏差为0。当然,可以合理地断定治疗导致了减少(尽管一个很小的)。

正如@whuber在下面的注释中指出的那样,值得指出的是,虽然0.00017看起来像是一个很小的数字,但从有意义的角度来看,它不一定很小。要知道这一点,我们需要了解几件事,首先是什么单位。如果单位非常大(例如,年,公里等),则看起来很小的单位可能会有意义地大,而如果单位很小(例如,秒,厘米等),则这种差异似乎会更小。其次,即使是很小的变化也可能很重要:想象一下一种非常便宜,易于在整个民众中使用且无副作用的治疗方法(例如疫苗)。即使只挽救了很少的生命,这也很值得。


感谢您的答复!我不太精通统计信息,所以当我没有得到我期望得到的答案时,我感到非常惊讶。平均值之间的差异的标准误差是:7.36764E-05。我不确定这有什么意义,但是我确定你确实是哈哈。再次感谢您的帮助
Kscicc26

不客气,@ Kscicc26。差异的标准误差和差异的标准偏差不是一回事。(可悲的是,它们听起来应该像应该的那样。)SD告诉您您的差异有多少差异,而SE告诉您,如果您一次又一次地反复进行研究,则平均差异的估算值会有多少差异。它可以帮助您在此处阅读我对SE的描述。
gung-恢复莫妮卡

我会检查一下并在早上回到该线程!
Kscicc26

2
这种平均差异既不小也不大:您根本没有评估其大小的依据。
ub

@whuber,这是个好主意-我不知道这些数字指的是什么。但是OP大概会认为它很小。我正在处理这些信息。
gung-恢复莫妮卡

9

要知道差异是大还是小,需要某种规模的度量,标准偏差是规模的一种度量,并且是t检验公式的一部分,以部分说明该规模。

考虑是否要比较5岁儿童的身高和20岁儿童的身高(人,相同地理区域等)。直觉告诉我们,那里存在实际的差异,如果高度以英寸或厘米为单位进行测量,则差异将是有意义的。但是,如果将高度转换为公里怎么办?还是光年?那么差异将是一个很小的数字(但仍会有所不同),但是(除非舍入误差),无论以英寸,厘米或公里为单位测量高度,t检验都将得出相同的结果。

因此,根据测量范围的不同,0.00017的差异可能很大。


4

Ťunlikely to emerge at least as large in another, similar pair of samples selected randomly from the same populations if the null hypothesis of no difference is literally true of those populationsŤ17100000

pop1=rep(15:20* .00001, 56);pop2=rep(0,336) #Some fake samples of sample size = 336
t.test(pop1,pop2,paired=T)                #Paired t-test with the following output...

Ť335=187.55p<2.2×10-16

.00001Ť

也许您比实际意义上的零假设重要性测试更感兴趣于实践意义。实际意义将更多地取决于上下文中数据的含义,而不是统计意义。这不是纯粹的统计问题。我在这里回答了一个普遍的问题,即适应p值的根深蒂固的观点时,引用了这个原理的一个有用示例:

[R=.03

这种“生死攸关的事情”基本上就是阿司匹林对心脏病发作的影响大小,这是一个很小的,数量少得多的,具有实际意义的一致差异的有力例子。您可以从中受益的许多其他答案都可以得到可靠的答案,其中包括:

参考

Rosenthal,R.,Rosnow,RL,和Rubin,DB(2000)。行为研究中的对比和影响大小:一种相关方法。剑桥大学出版社。


0

这是R中的一个例子,显示了实际的理论概念。10,000次掷硬币10,000次的正面概率为.0001的试验,与10,000次掷硬币10,000次的正面概率为.00011的试验

t.test(rbinom(10000,10000,.0001),rbinom(10000,10000,.00011))

t = -8.0299,df = 19886.35,p值= 1.03e-15替代假设:均值的真实差异不等于0 95%置信区间:-0.14493747 -0.08806253样本估计:x的平均值y的平均值0.9898 1.1063

就人类的感知而言,平均值的差异相对接近于0,但在统计学上却与0差异很大。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.