报告Welch t检验的自由度


14

不等方差的Welch t检验(也称为Welch-Satterthwaite或Welch-Aspin)通常具有非整数的自由度。报告测试结果时应如何引用这些自由度?

根据各种消息来源,“通常在查询标准t表之前先四舍五入为最接近的整数” *-这很有意义,因为这种舍入方向是保守的。**一些较旧的统计软件也可以这样做(例如,版本之前的Graphpad Prism 6),一些在线计算器仍然可以使用。如果已使用此程序,则报告四舍五入的自由度似乎是适当的。(尽管使用一些更好的软件可能更合适!)

但是绝大多数现代软件包都使用小数部分,因此在这种情况下,似乎应该引用小数部分。我看不出引用多于两个小数位是适当的,因为千分之一的自由度只会对p值产生微不足道的影响。

环顾Google学者,我可以看到一些论文用df整数,小数点后一位或小数点后两位。是否有关于使用多少精度的准则?此外,如果软件使用完整的小数部分,应在引用DF进行四舍五入向下到的数字的期望数目(例如7.5845...7.5至1个DP或7作为整体数目),为是适当的与保守计算,或者对我来说似乎更明智,按常规取整(至最接近的整数),以使7.5845...7.6至1 dp或8至最接近的整数?

编辑:除了了解报告非整数df的理论上最合理的方法外,了解人们在实践中的工作也将是一件好事。大概期刊和风格指南有其自己的要求。我很好奇,像APA这样需要有影响力的风格指南。据我所知(他们的手册不能在线免费获得),APA普遍认为几乎所有内容都应显示到小数点后两位,除了p值(可能是2或3 dp)和百分比(四舍五入为整数)。最接近的百分比) -覆盖回归斜率,统计,˚F统计,χ2统计资料等等。考虑到第二个小数位在有效位数上的差异非常大,这很不合逻辑,并且在2.47中表示的精度与982.47中的精度完全不同,但是这可能解释了我在不科学的样本中看到的带有两个小数位的Welch df的数量。

例如Ruxton,GD不等方差t检验是学生t检验和Mann–Whitney U检验的未充分使用的替代方法,行为生态学(2006年7月/八月)17(4):688-690 doi:10.1093 / beheco / ark016

虽然韦尔奇-萨特思韦特近似本身可能会或可能不会是保守的,在它不是保守的,舍去自由度的情况下是没有整体补偿的保证。


1
我尚未研究实际做法,这就是为什么这是评论而不是答案的原因,但是我希望它基于与报告重要数字有关的判断。对于相对较高的df,通常更改小数点后第一位根本不会改变p值(达到报告的精度水平),因此将其舍入为整数是可以的。对于非常低的DF 和的极值,所述衍生物| νt可以超过0.01,表明在这种情况下,应仅将ν报告为比p本身低的有效数字。|νFν(t)|0.01νp
ub

@whuber这确实是一个有用的观察,尤其是与Glen_b的答案一起使用时。 “非常低”有多低?(我对自己遇到的论文样本的怀疑是,很多“实际实践”可能与“良好实践”不同!知道什么是通用的报告准则。)ν
Silverfish,2014年

Answers:


10

我尚未研究实际操作,因此此答复无法解决问题的这一方面。作为一般原则,我希望在报告自由度(df)时对有效数字的处理应基于与有效数字有关的判断。

原则是一致的:以一种数量的精度使用适合与另一种数量相关的精度。具体来说,当报告值y = f x 时,将x赋给小值h的最接近倍数(例如h = 1)xy=f(x)xh为小数点后六个位置),在相对精度ÿ由函数作为介导˚Fh=12×106yf

suphkh|f(x+k)f(x)|h|ddxf(x)|.

在区间[ x - h x + h ]上可连续微分时,近似值适用。f[xh,x+h]

在本申请中, p值,x是自由度ν,并且ypxν

y=f(x)=f(ν)=Fν(t)

其中是韦尔奇-萨特思韦特统计和˚F ν是学生的CDF 与分布ν自由度。tFνtν

对于相对高DF ,经常在第一个小数位的改变将不会改变在所有的p值(到的精度水平报道),所以四舍五入为一个整数是细(ħ = 1 / 2,但ħ | dνh=1/2非常小)。对于非常低的df和统计值t的极值,导数的大小| h|ddxf(x)|t可以超过0.01,这表明在这种情况下,应仅将v报告为比p少一位小数。|νFν(t)|0.01νp

看到自己与最低的(合理的)DF和范围的微分值的大小的这个标记等高线图这将很有趣(因为它们可能导致较低的p值)。|t|

Figure

k(k+1)jth(j+k)th106ν=2.5t=83ν6+(3)=3

kν

430

Figure 2

νpν


1
这对于确定应以什么原则来取整自由度(+50!)非常有帮助。我希望以后的回答者可以填补有关实际练习的空白。
银鱼

7

在咨询标准t表之前,通常舍入到最接近的整数

约定的原因是因为表没有非整数df。没有其他理由。

这是合理的,因为此调整是保守的。

嗯,该统计信息实际上没有t分布,因为他的分母平方实际上没有缩放的卡方分布。这是一个近似值,在某些特定情况下可能是保守的,也可能不是保守的-当我们考虑特定情况下统计信息的确切分布时,四舍五入df不一定确定是保守的。

(通过内插还是通过用df实际计算t分布的数字?)

来自t分布的p值(将cdf应用于t统计量)可以通过各种非常精确的近似值来计算,因此可以有效地计算它们,而不是进行插值。

我看不到引用两个以上小数位是合适的

我同意。

是否有关于使用多少精度的准则?

一种可能是调查p值的Welch-Satterthwaite逼近在一般的方差比区域中有多准确,而没有引用比在df中暗示的要准确得多的相对准确度(请记住,df上的df分母的平方中的卡方只是给出了无论如何都不是卡方的近似值。


1
我应该澄清一下“四舍五入是保守的”。Welch-Satterthwaite逼近本身可能是保守的,也可能不是保守的。但是舍入的过程肯定是-如果近似值一开始并不保守,那么舍入后的坏处至少会减少。相反,四舍五入(例如“ 7.5845四舍五入为最接近的8”)绝对不是保守的调整。我可以找到一种更好的措辞措辞,但是我希望我的观点很清楚!
Silverfish

“一种可能性可能是研究在一般的方差比区域中p值的Welch-Satterthwaite近似有多精确”-这是非常明智的,并且似乎是有原则的方法。这是常做的事吗?一些实施的提示会很好。在实践中,我怀疑期刊风格指南通常对此事拥有最终决定权!但是我不知道他们在说什么-我搜索到的论文中肯定有各种各样的练习。
Silverfish

为了避免与未来的读者产生混淆,我尝试澄清问题正文中的保守估计。感谢您的接送。
Silverfish

我不认为通常会做任何事情,但是我不认为这不应该这样做。为何解释一轮/截短到某一点会进入论文的程度显然取决于期刊/编辑/裁判。
Glen_b-恢复莫妮卡2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.