“研究者的意图”和阈值/ p值


21

我正在阅读John Kruschke的“进行贝叶斯数据分析”幻灯片,但实际上对他对t检验和/或整个零假设重要性检验框架的解释存在疑问。他认为p值定义不明确,因为它们取决于研究者的意图。

他特别给出了两个实验室的示例(第3-6页),它们收集了比较两种治疗方法的相同数据集。一个实验室致力于从12个受试者中收集数据(每个条件6个),而另一个实验室则在固定的时间内收集数据,这恰好会产生12个受试者。根据滑动时,临界 -值对的不同这两个数据收集计划之间:对于前者,但对于后者!tp<0.05tcrit=2.33tcrit=2.45

我现在找不到的博客文章建议固定持续时间方案具有更大的自由度,因为他们可以从11、13或任何其他数量的主题收集数据,而固定N方案通过定义为。N=12

有人可以向我解释:

  • 为什么这些条件之间的临界值会有所不同?

  • (假设是一个问题)如何针对不同的停止标准进行校正/比较?

我知道根据显着性设置停止标准(例如,直到为止的样本)会增加I型错误的可能性,但这似乎没有发生,因为这两个停止规则都不取决于分析。p<0.05

Answers:


11

这是更多信息:http : //doingbayesiandataanalysis.blogspot.com/2012/07/sampling-distributions-of-t-when.html

此处提供了更完整的讨论:http : //www.indiana.edu/~kruschke/BEST/ 该文章考虑了p值,用于在阈值N处停止,在阈值持续时间处停止以及在阈值t值处停止。


哇!就像从马口中直接一样……这绝对不是我一个有趣的主意。感谢您提供其他信息。
马特·克劳斯

我想补充一点,克鲁斯克博士的(第11章)对此进行了详细讨论。
Matt Krause

13

我终于追踪到与幻灯片相关文件:Kruschke(2010)也可以直接从作者(通过鏁),在这里,因为该杂志没有得到广泛开展。解释有点平淡无奇,但我仍然不确定我是否会购买。

在固定N情况下,临界值的计算方式如下:从(相同)总体中随机抽取2 N个样本,并计算t值。重复此过程很多次以建立空分布。最后,将t c r i t设置为该分布的第95个百分点。t2NtŤC[R一世Ť

对于固定持续时间的情况,他假设对象的平均到达率。通过重复两个步骤来构造零分布。第一步,从带有参数λ的位置分布中得出每个条件N 1N 2的被摄对象数量。接下来,从总体中随机抽取N 1N 2来计算t值。这被重复许多次,和Ç ř 被设定为百分该分布的第95。λñ1个ñ2λñ1个ñ2ŤŤC[R一世Ť

在我看来,这有点...时髦。据我了解,不存在单一的。相反,它是一个分布族,其形状部分由自由度参数确定。对于固定的N个条件,每组有N个对象,并且未配对t检验的合适t值是具有2 N - 2自由度的那个,这大概是他的模拟所再现的。 ŤññŤ2ñ-2

ŤŤλ=ñ2ñ-ñŤν=1个ν=5Ť

综上所述:

  • ŤC[R一世Ť
  • Ť
  • 我仍然不相信这实际上是一个问题,但是如果有人认为不是,我将很乐意阅读/支持/接受答案。

为什么您可以回答自己的问题并给它打勾?看来您不应该让自己成为代表脚尖!
Michael R. Chernick

5
迈克尔,回答他自己的问题没有错。
chl 2012年

@MichaelChernick,如果您接受自己的回答,我相信您不会得到任何代表。当时,这似乎是正确的做法,因为在接下来的两个星期中我或多或少地追踪了答案,但由于约翰·克鲁施克显然是他自己的权威,所以我已将接受改为约翰·K·克鲁施克的回答。幻灯片:-)
Matt Krause 2012年

有趣的感谢。但是我不明白为什么即使看起来正确和最佳,也应该随时检查自己的答案。我们已经确定,检查您自己的答案不会给您代表分数。
Michael R. Chernick

3
由于将答案标记为已接受,除了指示正确的解决方案(针对将来的访问者)之外,没有其他目的,尤其是在没有其他建议的情况下,我认为这没有问题。就个人而言,我很早以前就对此答案表示赞同,因为我感谢OP使我们能够从自己的研究中受益。非常抱歉,我不能为跟随该主题并更新他的决定这一简单事实再投票。PS: “我们已经建立了……”是指为什么可以给自己信誉点?
chl 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.