我正在阅读John Kruschke的“进行贝叶斯数据分析”幻灯片,但实际上对他对t检验和/或整个零假设重要性检验框架的解释存在疑问。他认为p值定义不明确,因为它们取决于研究者的意图。
他特别给出了两个实验室的示例(第3-6页),它们收集了比较两种治疗方法的相同数据集。一个实验室致力于从12个受试者中收集数据(每个条件6个),而另一个实验室则在固定的时间内收集数据,这恰好会产生12个受试者。根据滑动时,临界 -值对的不同这两个数据收集计划之间:对于前者,但对于后者!
我现在找不到的博客文章建议固定持续时间方案具有更大的自由度,因为他们可以从11、13或任何其他数量的主题收集数据,而固定N方案通过定义为。
有人可以向我解释:
为什么这些条件之间的临界值会有所不同?
(假设是一个问题)如何针对不同的停止标准进行校正/比较?
我知道根据显着性设置停止标准(例如,直到为止的样本)会增加I型错误的可能性,但这似乎没有发生,因为这两个停止规则都不取决于分析。