我可以简单地说一下,因为原假设检验实际上只是关于原假设。通常,原假设通常不是人们所关注的,甚至可能不是“现状”,尤其是在假设检验的回归类型中。在社会科学中通常没有现状,因此零假设可以是任意的。由于起点是不确定的,因此这对分析产生了巨大的影响,因此不同的研究从不同的零假设开始,最有可能基于其可用的任何数据。将此与牛顿运动定律进行比较-将其作为零假设是有意义的,并尝试从此出发点寻找更好的理论。
此外,p值不能计算正确的概率-我们不希望知道尾部概率,除非随着您进一步进入尾部而更有可能提出替代假设。您真正想要的是理论预测实际看到的内容的能力。例如,假设我预测“小雨”的可能性为50%,而我的竞争对手预测为75%的机会。事实证明这是正确的,我们观察到有阵雨。现在,当确定哪个气象人员是正确的时,您不应再因给予40%的“雷暴”机会而给我的预测以其他荣誉,也不应因给予“雷暴”的0%机会而使我的竞争对手屈服。
IDH
BF=P(D|HI)P(D|H¯¯¯¯¯I)
HBF=∞H0.001
104,490,00052,263,471y∼Bin(n,0.5)y|θ∼Bin(n,θ)θ∼U(0,1)y∼BetaBin(n,1,1)∼DU(0,…,n)p=0.00015
BF=(ny)2−n1n+1=(n+1)!2ny!(n−y)!=11.90
怎么会这样?尽管p值很小,贝叶斯因子仍支持原假设。好吧,看一下替代方案-它给出了观察值 -替代方案不能为事实提供良好的解释-因此,更可能使用null,但仅相对于另一种。请注意,null仅于此。但这仍然比替代方案更好。1n+1=0.00000000960.00000011
对于盖尔曼(Gelman)批评的例子而言,尤其如此-真的只检验了一种假设,而没有考虑太多。以前的研究支持的替代方案,最重要的是,c)他们做出什么预测(如果有),与零值有实质性的不同?
但是请注意,是未定义的,基本上代表了与先前信息一致的所有其他假设。真正正确进行假设检验的唯一方法是,指定要比较的一系列替代方案。即使你做到这一点,说你有,您只能在该数据支持的事实报告相对于您所指定的内容。如果您从备选方案集中遗漏了重要的假设,则可能会得到无意义的结果。此外,给定的替代方案可能证明比其他替代方案更合适,但仍然不太可能。如果您有一项p值为H¯¯¯¯¯H1,…,HKHk0.01但是p值为一百种不同的测试中,“最佳假设”(最佳含义比真实含义更好)实际上更有可能来自“几乎有意义”的结果组。0.1
需要强调的重点是,永远不可能存在一个孤立于假设的假设。因为,在指定了理论/模型之后,您总可以添加一个新的假设
实际上,这种类型的假设实际上是科学的进步-某人有了新的想法/ explanation产生某种效果,然后针对当前的替代方案测试这一新理论。它的与,而不仅仅是与。简化版本仅适用于有非常受支持的假设时H K + 1 = H K + 1 H 1,… ,H K H 0 H A H 1,… ,H K还没想到K
HK+1=Something else not yet thought of
HK+1H1,…,HKH0HAH1,…,HK-即,在我们目前拥有的所有思想和解释中,有一种占主导地位的理论很突出。对于社会/政治科学,经济学和心理学的大多数领域,绝对不是这样。