F表的自由度无法满足我的大样本要求。
例如,如果我有一个自由度为5和6744的F,我如何找到方差分析的5%临界值?
如果我在进行具有较大自由度的卡方检验该怎么办?
[这样的问题是在不久前发布的,但是OP出错了,实际上是一个较小的df,将其减少为重复的-但原来的大df问题应该在现场的某个地方有一个答案]
F表的自由度无法满足我的大样本要求。
例如,如果我有一个自由度为5和6744的F,我如何找到方差分析的5%临界值?
如果我在进行具有较大自由度的卡方检验该怎么办?
[这样的问题是在不久前发布的,但是OP出错了,实际上是一个较小的df,将其减少为重复的-但原来的大df问题应该在现场的某个地方有一个答案]
Answers:
F表:
最简单的方法(如果可以的话)是使用统计数据包或其他程序为您提供关键价值。因此,例如,在R中,我们可以这样做:
qf(.95,5,6744)
[1] 2.215425
(但您可以轻松计算出F的确切p值)。
通常,F表在表的末尾具有“无限”的自由度,但有些不是。如果您的df很大(例如6744很大),则可以在其位置使用无穷大()条目。
因此,您可能具有表,这些表给出了120 df和 df:
... 5 ...
⁞
120 2.2899
∞ 2.2141
那里的 df行将适用于任何非常大的(分母df)。如果使用它,我们将使用2.2141而不是精确的2.2154,但这还不错。
如果没有无穷大的自由度输入项,则可以使用卡分子df的临界值除以那些df,从卡方表中算出一个
因此,例如,对于临界值,取临界值并除以。对于5%的临界值是。如果我们除以这就是这是从上面的表行。
如果您的自由度可能太小而无法使用“无穷大”项(但仍比120大得多,或者您的表达到的最大值),则可以在最高有限df和无穷大项之间使用反插值。假设我们要计算 df 的临界值
F df 120/df
------ ---- -------
2.2899 120 1
C 674 0.17804
2.2141 ∞ 0
然后我们计算未知临界值为
(精确值为,因此效果很好。)
在该链接的文章中提供了有关插值和逆插值的更多详细信息。
卡方表:
如果您的卡方df确实很大,则可以使用法线表获得近似值。
对于大df,卡方分布近似于正态分布,均值和方差。要获得较高的5%值,请为标准法线()选择单尾5%的临界值,然后乘以并加上。
例如,假设我们需要的较高5%临界值。
我们将计算。准确的答案(对有效数字)是。
如果自由度较小,则可以使用以下事实:如果为则。
因此,例如,如果我们有 df,则可以使用此近似值。对于具有674 df的卡方,精确的5%上限值是(至5个数字)。通过这种近似,我们将计算如下:
取标准法线(1.645)的较高(尾部为5%)的临界值,加上,将总数求平方并除以2。在这种情况下:
。
如我们所见,这非常接近。
对于相对较小的自由度,可以使用Wilson-Hilferty变换-仅在少数几个自由度下都可以正常工作-但表格应涵盖这一点。该近似值是。
R
df2/df1 * (-1 + 1/(1-qchisq(0.95, df1) / df2))