Answers:
这是一个很好的问题,我期待每个人都能解释p值以及两尾与单尾测试。我一直在教骨科医生统计数据,因此我尝试使它尽可能基本,因为大多数人10到30年没有做任何高级数学了。
首先,我要解释的是,如果我们相信我们有一个公平的硬币,我们知道它应该会平均甩掉50%的掷硬币()。现在,如果您想知道用这种公平的硬币在10次翻转中仅获得2条尾巴的概率,您可以像在条形图中所做的那样计算该概率。从上图可以看到,听到8出10的概率有一个公平的硬币翻转约约≈ 4.4 %。
由于我们会对硬币的公平性提出质疑,如果我们得到9或10条尾巴,我们就必须包括这些可能性,即测试的尾巴。通过添加值,我们得到的概率现在是一个多一点获得2尾以下。
现在,如果我们只得到2个正面,即8个正面(另一个反面),我们很可能会质疑硬币的公平性。这意味着你最终的概率为的双尾检验。
由于我们医学界通常对研究失败感兴趣,因此即使我们的目的是做好事并引入有益的治疗方法,我们也需要将可能性的另一面包括在内。
这个简单的例子还显示了我们如何依赖零假设来计算p值。我还想指出二项式曲线和钟形曲线之间的相似之处。当更改为200次翻转时,您会自然地解释为什么恰好获得100次翻转的可能性开始变得不相关。感兴趣的定义区间是概率密度/质量函数函数及其累积对应物的自然过渡。
在我的课堂上,我向他们推荐可汗学院的统计视频,并且我还使用他对某些概念的解释。他们还可以翻转硬币,以便我们观察硬币翻转的随机性-我试图证明的是,随机性比我们通常认为的受Radiolab情节启发的随机性要大。
我通常有一个图形/幻灯片,即我用来创建图形的R代码:
library(graphics)
binom_plot_function <- function(x_max, my_title = FALSE, my_prob = .5, edges = 0,
col=c("green", "gold", "red")){
barplot(
dbinom(0:x_max, x_max, my_prob)*100,
col=c(rep(col[1], edges), rep(col[2], x_max-2*edges+1), rep(col[3], edges)),
#names=0:x_max,
ylab="Probability %",
xlab="Number of tails", names.arg=0:x_max)
if (my_title != FALSE ){
title(main=my_title)
}
}
binom_plot_function(10, paste("Flipping coins", 10, "times"), edges=0, col=c("#449944", "gold", "#994444"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", "gold"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", rgb(200/255, 100/255, 100/255)))
假设您要检验男性平均身高为“ 5英尺7英寸”的假设。您选择一个随机样本的男性,测量其身高并计算样本均值。那么您的假设是:
在上述情况下,您进行了两尾测试,因为如果样本平均值太低或太高,您将拒绝null。
在这种情况下,p值表示实现样本均值的概率,该均值至少与我们假设空值实际上为真而实际获得的均值一样极端。因此,如果观察到样本平均值为“ 5 ft 8英寸”,则p值将表示我们观察到的高度大于“ 5 ft 8英寸”或小于“ 5 ft 6英寸”的高度(如果为空)的概率是真的。
另一方面,如果您的选择框架如下所示:
在上述情况下,您将在右侧进行单尾测试。原因是,仅当样本均值极高时,您才更愿意拒绝null以便选择替代方案。
p值的解释与我们现在谈论的实现样本均值的概率大于实际获得的均值的细微差别保持不变。因此,如果观察到样本均值为“ 5 ft 8英寸”,则p值将表示我们观察到的高度大于“ 5 ft 8英寸”的概率(如果null为真)。