背景:
我必须为绝对是统计初学者的客户(某种律师)进行数据分析。他问我“统计意义”一词的含义,我真的试图解释它……但是由于我不擅长解释事情,所以我失败了;)
背景:
我必须为绝对是统计初学者的客户(某种律师)进行数据分析。他问我“统计意义”一词的含义,我真的试图解释它……但是由于我不擅长解释事情,所以我失败了;)
Answers:
差异是偶然的结果。
当我们认为某件事在统计上很重要时,我们相信差异大于合理地解释为偶然事件的可能性。
注意:我想在这个答案中强调的是统计显着性是一个有用的工具,但也不同于事实。
拿一包52张卡片。如果我的客户是无辜的,那是一副普通的卡片,共13张心。如果我的客户在说谎,那是固定的包装,所有52张卡片都是心脏。
我画了第一张牌,这是一颗心。啊,有罪!好吧,很明显,常识告诉我们事实并非如此:即使他是无辜的,也会有四分之一的机会发生这种情况。仅看一张卡片就没有统计意义。
因此,我们抽出第二张牌。另一颗心。嗯...那一定是有罪的!好了,剩下的51张卡片中仍然有12张红心,所以这并非没有可能。数学(13/52 * 12/51 = 0.0588)告诉我们,即使是无辜的,这种情况也会发生大约6%的时间。对于大多数科学家来说,这仍然不算数。
画第三张牌,另一颗心!连续三个。发生这种情况的可能性为(13/52 * 12/51 * 11/50 = 0.01294),因此,偶然发生这种情况的可能性超过1%。
在许多科学中,5%用作临界点。因此,如果除了这三张牌之外,您没有其他证据,那么您在统计上就可以证明他有罪。
重要的一点是,允许您查看的牌越多,您对他的内感的信心就越大,这是另一种说法,即统计学意义越高。
注意:除非允许您查看14张卡片,否则您永远不会证明他有罪。理论上,使用一包普通的纸牌可以连续绘制13张心,但是不可能有14张心。[除了学步车:我们假设卡片上的数字不可见;所有卡都是四种可能的西装之一,就是这样。
注意:当您抽出除心脏以外的任何卡片时,您就可以证明他的纯真。这是因为只有两种可能的包装:正常或全心全意。现实生活更加复杂,数学也变得更加复杂。
顺便说一句,如果您的客户不是纸牌玩家,请尝试“大富翁”(Monopoly)。但如果有人每次怀疑时都会掷双六的话。统计数据仅使我们能够准确地确定我们应该多可疑。
我个人的建议是不要谈论以下事情:
不要对律师太在意。这是一个受过良好教育的人,至少在大学统计学课上度过了一个学期,但其中的一点点都没有。对于与我合作过的几乎所有其他非科学家来说,情况都是一样的-统计意义并不固定。这个概念太不自然了。
我鼓励您用证据解释统计意义。古典统计学家在0到1的范围内对证据进行编码,其中较小的值构成更多的证据,而按常规绘制界限则为0.05。
保持简洁明了!
p值定义为在假设null为真的情况下获得或超过观察到的结果的可能性。如果p值足够小,则null可能不正确。对于我们认为足够小的“ alpha”,我们可以任意选择一个截止值;对于所有低于alpha的p值,我们都拒绝使用null。
这就是我向简介统计课解释的方式。
我会尽力。
首先,您需要根据平均数据以及数据的可变性来计算p值。变量越大,获得小的p值的可能性就越小。另一方面,例如,如果要比较两个组,则它们的平均值之间的差异越大,则p值越小。
而且,通过具有更多数据,可以在某种程度上抵消数据的可变性。以两个平均值之间相同的差异和相同的可变性对两组数据进行成像。在这种情况下,样本量较大的集合的p值较小。
测试部分只是查看p值是否小于某个数字。通常人们使用.05,但这是任意的社会习惯。许多人认为使用任意数字是没有意义的,但是由于历史原因,这种情况非常普遍。
还请记住,仅仅因为您的显着性检验表明两组之间存在差异,并不意味着您知道为什么存在差异。另一方面,如果测试表明没有显着差异,那可能仅仅是因为您的可变性太大,并且您没有足够的数据来获得低p值,这并不意味着没有实际差异。
编辑:
综上所述,较低的p值意味着有更多的证据反对这一预测:
与预测结果的差异->下p值
更多数据->下p值
更多可变性->向上p值
p值下降意味着更多证据表明该预测是错误的。历史上的每个预测都显示为假到小数点后一位。
统计重要性是用于提供接受或拒绝给定假设的理由的概念。给定一组数据,分析师可以计算统计数据并确定不同变量之间各种关系的大小。
统计工作是确定数据是否包含足够的证据,以使您能够得出结论:计算出的统计数据或变量之间观察到的关系可以解释为真实陈述,或者样本数据中观察到的结果仅仅是由于偶然。这是通过确定一些样本统计量来完成的,如果原始假设为真,则将显示某些特征,但如果原始假设为假,则不会。相关样本统计数据似乎越显示出在原假设下预期的特征,则原假设正确的统计证据越强。同样,在原假设下,样本统计数据似乎表现出较少的预期特征,则原假设正确的统计证据越弱。
样本统计量在零值下展现出预期特征的数量是一个程度的问题,但是为了得出是否接受或拒绝零值假设的结论,必须有一些任意的界限。这样,选择截止值。如果样本统计量在临界值之内或在该临界值的一侧,则认为它符合零假设下预期的特征,因此对于给定的临界值(例如,在5%的alpha值),结果可以被认为具有统计学意义水平)。如果相关样本统计量位于临界值的另一侧,则认为该统计值不符合零假设下的预期特征,因此,对于给定的临界值,该结果在统计上并不重要。