我已经完成了数据分析并获得了“统计学上显着的结果”,这与我的假设一致。但是,一位统计学专业的学生告诉我,这是一个过早的结论。为什么?我的报告中还需要包含其他内容吗?
我已经完成了数据分析并获得了“统计学上显着的结果”,这与我的假设一致。但是,一位统计学专业的学生告诉我,这是一个过早的结论。为什么?我的报告中还需要包含其他内容吗?
Answers:
通常,假设以二进制方式构成。我将方向性假设放到一边,因为它们不会改变很多问题。至少在心理学上,谈论诸如以下假设是很普遍的:组均值之间的差为零或不为零;相关性为零或不为零;回归系数为零或不为零;r平方为零或不为零。在所有这些情况下,都有无效的无效假设和无效的备用假设。
通常,这种二元思维不是我们最感兴趣的。一旦您考虑了您的研究问题,您几乎总会发现您实际上对估计参数感兴趣。您对组均值之间的实际差异,相关性的大小,回归系数的大小或所解释的方差量感兴趣。
当然,当我们获得数据样本时,参数的样本估计与总体参数不同。因此,我们需要一种量化参数值不确定性的方法。从频繁主义者的角度来看,置信区间提供了一种做事的手段,尽管贝叶斯纯粹主义者可能会争辩说,他们严格禁止您可能想做出的推断。从贝叶斯角度来看,可靠的后验密度区间提供了一种更直接的方法来量化您对总体参数值的不确定性。
心理学(及其他领域)上有大量文献批评集中在p值,无效假设显着性检验等上(请参阅Google学术搜索)。该文献经常建议以置信区间作为解决方案来报告效应量(例如,Wilkinson的APA工作组,1999年)。
如果您正在考虑采用这种想法,我认为您可以采用越来越复杂的方法:
在许多可能的参考文献中,您会看到Andrew Gelman在他的博客和研究中谈论了很多这些问题。
只是添加到现有的答案(顺便说一句,这很好)。重要的是要意识到统计显着性是样本量的函数。
当您获得越来越多的数据时,无论您在哪里看,都可以发现统计上的显着差异。当数据量巨大时,即使是最小的影响也可能导致统计意义。这并不意味着上述效果在任何实际意义上都是有意义的。
在进行研究之前,如果有合理的基础怀疑您的假设是正确的;并且您进行了很好的学习(例如,您没有引起任何混淆);并且您的结果与您的假设一致且具有统计意义;那么我认为您还可以,就目前而言。
但是,您不应认为重要性对您的结果至关重要。首先,您还应该查看效果大小(请参阅此处的答案:效果大小作为重要性检验的假设)。您可能还想稍微探索一下数据,看看是否可以找到值得继续关注的任何潜在有趣的惊喜。
在报告此事,此事和此事之前,首先要制定要从实验数据中学到的知识。通常的假设检验(我们在学校学习的这些检验...)的主要问题不是二元性:主要问题是这些假设不是针对感兴趣的假设的检验。参见此处的幻灯片13(下载pdf欣赏动画)。关于效果大小,此概念没有一般定义。坦率地说,我不建议非专业统计学家使用此方法,因为这是技术性的而非自然的“影响”度量。您的兴趣假设应以通俗易懂的术语表述。
如果不知道您的研究的更多细节和该人的批评,就不可能准确回答。但这是一种可能:如果您运行了多个测试,并且选择专注于出现在其中的一个测试p<0.05
而忽略了其他测试,那么“重要性”已经因为您选择性地关注它而被淡化了。作为一个直觉泵,记住这p=0.05
意味着“即使原假设为真,该结果也会(仅)在5%的情况下偶然发生”。因此,您运行的测试次数越多,其中至少有一个机会偶然出现“重大”结果的可能性就越大,即使那里没有影响。参见http://en.wikipedia.org/wiki/Multiple_comparisons和http://en.wikipedia.org/wiki/Post-hoc_analysis