假设您有一组数据。数据由长度(L),宽度(W),高度(H)和体积(V)组成。
如果我们对盒子/几何不太了解,可以尝试模型:
V = a*L + b*W + c*H + e
该模型具有三个可以改变的参数(a,b,c),以及描述假设与数据拟合程度的误差/成本项(e)。参数值的每种组合都将被视为不同的假设。选择的“默认”参数值通常为零,在上面的示例中,它对应于V与L,W,H之间的“无关系”。
人们要做的是通过检查e是否超出某个临界值来检验该“默认”假设,通常是通过假设模型拟合周围误差的正态分布来计算p值来进行的。如果该假设被拒绝,那么他们会找到a,b,c参数的组合,从而使可能性最大化,并提出这是最可能的假设。如果它们是贝叶斯方法,则将每组参数值的可能性乘以先验,然后选择使后验概率最大化的解决方案。
显然,这种策略不是最优的,因为该模型假定了可加性,并且会错过正确的假设是:
V = L*W*H + e
编辑:
@Pinocchio
当没有合理的理由从无限多种可能中选择一个/几个函数(或您所说的“假设类别”)时,也许有人不同意假设检验不是最优的说法。当然,这是很简单的,并且可以在“给定成本函数和所提供的选择的情况下最适合”的有限意义上使用“最佳”。该评论使之成为我的答案,因为我不喜欢您的课堂笔记中如何掩盖模型规范问题。这是大多数科学工作者面临的主要问题,对于afaik而言,没有算法。
此外,在我了解历史记录之前,我无法理解p值,假设检验等,因此也许对您也有帮助。频繁的假设检验存在多种混乱的来源(我对贝叶斯变体的历史不太了解)。
在Neyman-Pearson的意义上,最初有所谓的“假设检验”,是Ronald Fisher所开发的“重要性检验”,也是在整个科学中广泛使用的这两种策略的定义不明确,从不恰当的“混合”式(可以使用以上术语或“无效假设显着性检验”来随意提及)。尽管我不建议您以维基百科页面为权威,但可以在此处找到许多讨论这些问题的资料。一些要点:
使用“默认”假设不是原始假设测试过程的一部分,而是应该使用户使用先验知识来确定所考虑的模型。如果我们没有特别的理由选择给定的假设进行比较,那么该模型的支持者们从未明确建议过该怎么做。人们常说,这种方法适用于质量控制,如果有已知的公差可以与某些测量结果进行比较。
在费舍尔的“重要性检验”范式下没有其他假设,只有零假设,如果根据数据认为不太可能,则可以拒绝该假设。从我的阅读中,费舍尔本人对默认无效假设的使用模棱两可。我永远找不到他对此事发表明确评论,但是他当然不建议这应该是唯一的无效假设。
默认零假设的使用有时被解释为假设检验的“滥用”,但对于提到的流行混合方法至关重要。有观点认为,这种做法通常是“无用的准备”:
“研究人员制定了理论预测,通常是作用的方向……当数据实际上显示出预测的定向结果时,这似乎证实了这一假设。研究人员测试了“稻草人”无效假设,即该影响实际上是零。如果不能在.05级别(或某些变体)上拒绝后者,那么就不能要求对该理论进行明显的确认...这种类型的测试中的一个常见错误是混淆了实际达到的显着性水平(对于拒绝具有原始理论所达到的确认水平的稻草人零用...确认的强度实际上取决于[研究人员的数值预测的敏锐度],而不取决于稻草人零用的显着性水平。”
原假设检验心理学的争议。戴维·H·克兰兹(David H Krantz)。美国统计协会杂志;1999年12月;94、448;1372-1381
可汗学院的视频就是这种混合方法的一个例子,并且犯了该引用中提到的错误。从该视频中获得的信息,我们只能得出结论,即注射的大鼠与未注射的大鼠有所不同,而视频中则声称我们可以得出结论:“该药肯定有一定作用”。进行一些反思会使我们考虑到,被测试的大鼠可能比未注射的大鼠要大,等等。在为我们的理论寻求证据之前,我们需要排除可能的替代解释。该理论的预测越具体,则完成该任务就越困难。
编辑2:
也许以您的医疗诊断记录为例将有所帮助。说患者可以是“正常”或“高血压危机”。
我们有事先的信息,只有1%的人处于高血压危机中。患有高血压危机的人的收缩压遵循正态分布,均值= 180,标准差= 10。同时,正常人的血压来自正态分布,平均值为120,标准差为10。判断一个人正常时的成本为零,错过诊断的成本为1,由于治疗带来的副作用的成本为0.2,无论他们是否处于危机之中。然后,下面的R代码计算阈值(eta)和似然比。如果似然比大于我们决定处理的阈值,如果小于,则不决定:
#Prior probabilities
P0=.99 #Prior probability patient is normal
P1=1-P0 #Prior probability patient is in crisis
#Hypotheses
H0<-dnorm(x=50:250, mean=120, sd=10) #H0: Patient is normal
H1<-dnorm(x=50:250, mean=180, sd=10) #H1: Patient in hypertensive crisis
#Costs
C00=0 #Decide normal when normal
C01=1 #Decide normal when in crisis
C10=.2 #Decide crisis when normal
C11=.2 #Decide crisis when in crisis
#Threshold
eta=P0*(C10-C00)/ P1*(C01-C11)
#Blood Pressure Measurements
y<-rnorm(3, 150, 20)
#Calculate Likelihood of Each Datapoint Given Each Hypothesis
L0vec=dnorm(x=y, mean=120, sd=10) #Vector of Likelihoods under H0
L1vec=dnorm(x=y, mean=180, sd=10) #Vector of Likelihoods under H1
#P(y|H) is the product of the likelihoods under each hypothesis
L0<-prod(L0vec)
L1<-prod(L1vec)
#L(y) is the ratio of the two likelihoods
LikRatio<-L1/L0
#Plot
plot(50:250, H0, type="l", col="Green", lwd=4,
xlab=" Systolic Blood Pressure", ylab="Probability Density Given Model",
main=paste0("L=",signif(LikRatio,3)," eta=", signif(eta,3)))
lines(50:250, H1, col="Red", lwd=4)
abline(v=y)
#Decision
if(LikRatio>eta){
print("L > eta ---> Decision: Treat Patient")
}else{
print("L < eta ---> Do Not Treat Patient")
}
在上述情况下,阈值eta = 15.84。如果我们进行三个血压测量并得出139.9237、125.2278、190.3765,则H1的可能性比为27.6:患有高血压危机的患者。由于27.6大于我们将选择处理的阈值。该图以绿色显示正常假设,以红色显示高血压。黑色竖线表示观察值。
