考虑,和临界值之间关系的最佳方法是使用图片:pFp
这里的曲线是分布,即原假设是否成立的统计量的分布。在此图中,观察到的统计量是从黑色虚线到垂直轴的距离。该值从曲线下的深蓝色区域到无穷远。请注意,每个值必须对应于唯一的值,较高的值对应于较低的值。F F p F F p F pFFFpFFpFp
您应该注意到零假设下关于分布的其他一些事情:
1)值极不可能接近零(这并不总是正确的,但在此示例中对于曲线是正确的)F
2)在某一点之后,越大,则可能性越小。(曲线向右逐渐变细。)F
临界值也出现在该图中。从到无穷大的曲线下面积等于显着性水平(此处为5%)。您可以说这里的统计量将导致无法拒绝原假设,因为它小于,也就是说,其值大于0.05。在此特定示例中,,但是您需要一个标尺来手动计算它:-)C F C p p = 0.175CCFCpp=0.175
请注意,分布的形状取决于其自由度,对于ANOVA,自由度对应于组数(减去1)和观测值(组数减去)。通常,曲线的整体“形状” 由第一个数字确定,而其“平坦度”由第二个数字确定。上面的示例具有(4个组),但是您会看到设置(3个组)会产生明显不同的曲线:F d f 1 = 3 d f 1 = 2FFdf1=3df1=2
您可以在Mr. Wikipedia Page上看到曲线的其他变体。值得注意的是,由于统计量是一个比率,因此即使存在较大的自由度,在原假设下,大数也很少见。这与统计信息相反,后者不除以组数,而是随自由度而增长。(否则是类似于在这个意义上,是从正态分布衍生分数,而源自 -分布式的统计信息。)χ 2 χ 2 ˚F χ 2 Ž ˚F 吨吨Fχ2χ2Fχ2zFtt
这比我想输入的要多得多,但我希望能涵盖您的问题!
(如果您想知道图表的来源,它们是由我的桌面统计信息包Wizard自动生成的。)
summary(aov(dependendVar ~ IndependendVar)))
或summary(lm(dependendVar ~ IndependendVar))
?您是说所有组均值彼此相等且等于0还是彼此相等?