我想学习方差分析。在我开始学习算法如何工作(必须进行哪些计算)以及为什么工作之前,我首先想知道我们使用ANOVA实际解决了什么问题,或者我们试图回答什么问题。换句话说:算法的输入是什么,输出是什么?
我确实了解我们用作输入的内容。我们有一组数字。每个数字都带有一个或多个分类变量(也称为“因子”)的值。例如:
+------------+------------+-------+
| factor 1 | factor 2 | value |
+------------+------------+-------+
| "A" | "a" | 1.0 |
| "A" | "a" | 2.4 |
| "A" | "b" | 0.3 |
| "A" | "b" | 7.4 |
| "B" | "a" | 1.2 |
| "B" | "a" | 8.4 |
| "B" | "b" | 0.4 |
| "B" | "b" | 7.2 |
+------------+------------+-------+
说方差分析计算零假设的p值是否正确,该假设表明因素对值的平均值没有影响?换句话说,我们将上述给定的数据提供给算法,结果我们得到了原假设的p值?
如果是这样,我们实际使用什么度量来计算p值。例如,我们可以说,给定零假设M可能与观察到的假设一样高(甚至更高),仅偶然发生1%的情况。什么是M?
我们不是也分别调查方差分析中的因素吗?方差分析可以说factor_1起作用,而factor_2没有吗?ANOVA是否可以说,对于给定的因子值,与值“ A”,“ B”和“ C”相对应的值在统计上是无法区分的(例如,均值相同),但是值“ D”具有影响?