为什么千分之六的说服力比十分之六的说服力更强?


41

请参阅Stella Cottrell撰写的“学习技巧手册”(帕拉格雷夫,2012年)第155页的摘录:

百分比给出百分比时请注意。
假设上面的语句改为:

60%的人更喜欢橘子;40%的人说他们更喜欢苹果。

这看起来很有说服力:给出了数量。但是60%和40%之间的差异显着吗?在这里,我们需要知道有多少人被问到。如果要问1000个人中谁喜欢600个橘子,这个数字很有说服力。但是,如果仅询问10个人,则60%的回答仅表示6个人更喜欢橙子。“ 60%”听起来令人信服,而“十分之六”则无法令人信服。作为重要的读者,您需要警惕用于使不足的数据令人印象深刻的百分比。

统计学中这种特征是什么?我想了解更多。


38
样本大小很重要
阿克萨卡尔州

36
我随机选择两个人,他们都是男性,因此我得出结论:100%的美国人是男性。有说服力?
Casey

2
这是“不要把苹果和橘子
相提并论

2
要从另一个角度解决该问题,您可以考虑挖掘有关成帧效果的文献。但是,这是认知偏见的一个示例,是一个心理主题,而不是统计主题。
Larx

2
您可以想象差异1将对估计数量有多大影响。从6/10到7/10比从601/1000到600/1000更远。
mathreadler '17

Answers:


54

我想列举另一个直观的例子。

假设我告诉你我可以预测任何抛硬币的结果。您不相信并且不想测试我的能力。

您测试了5次,我都正确了。你相信我有特殊能力吗?也许不吧。因为我可以偶然地使所有这些正确。(具体来说,假设硬币是一枚公平的硬币,并且每个实验都是独立的,那么我可以获得所有权利而没有超能力。有关此事的笑话,请参阅洗牌手的链接)。0.550.03

另一方面,如果您对我进行了大量测试,那么我偶然获得它的可能性就很小。例如,如果您测试了次,那么我将它们全部正确设置的概率为。0.5 10001000.51000


统计概念被称为Wikipeida的统计能力

二元假设检验的功效是当替代假设(H1)为真时,该检验正确拒绝零假设(H0)的概率。

回到超级掷硬币的例子,您基本上要运行假设检验。

  • 无效假设(H0):我没有超级能力
  • 替代假设(H1):我拥有超能力

现在,如您在数值示例中看到的(测试5次vs测试100次),统计功效受到样本量的影响。

更多阅读这里。(更多技术信息并基于t检验)。

可以在此处找到了解统计能力的交互式工具。注意,统计功效随样本量的变化而变化!

在此处输入图片说明


24
强制性XKCD
Shufflepants

5
这实际上并不能回答问题。这个问题分为两个部分:“为什么[它]更令人信服……”和“统计中所谓的这一特征是什么?” 您提供了一个示例,询问读者是否对示例更信服,但是您没有解释这种现象,也未尝试说明为什么它更具说服力(仅依靠读者在单个示例上的直观推理即可)。此外,您还没有涉及第二个问题:如果您认为这种现象没有名字,请明确指出。
Makyen '17

1
@Mayken显然是一个尝试的答案。这不是最大的答案,也不是一个完整的答案,但部分或草率的答案并不是声称它根本不是答案的理由。问题应该问一个问题,如果他们问一系列问题,我认为仅解决其中一些问题是完全合理的(如果不理想的话)。如果您认为答案很差,那么您当然可以自由解决自己认为是问题的问题。[对此,我也不认为我回答了第二个问题。我只讨论了效果;并非每个现象都有一个明确的名称]
Glen_b

1
我忍不住觉得100%是一个特例,这个答案并不能真正支持我的直觉,即600/1000比6/10更令人信服。即使我们认为这不是特殊情况,这实际上只是以不同的百分比来重述该问题。
NotThatGuy

2
@Juya这是某人构建的基于Web的工具。您可以在这里
Haitao Du

29

考虑比例。假设喜欢橙色是成功的,而喜欢苹果是失败的。因此,您的平均成功率为μ =成功次数或在这种情况下为.6μ=成功次数ñ

该数量的标准误估计为。对于一个小的样品尺寸(即10),标准误差为0.155但对于1000样本大小,标准误差为0.0155。因此,正如评论中提到的,基本上,“样本量很重要”。μ1个-μñ.155.0155


17

这个概念是大量定律的结果。从维基百科

根据法律,从大量试验中获得的结果平均值应接近预期值,并且随着进行更多试验而趋于接近。

小样本的结果可能比大样本的结果离期望值更远。因此,正如问题中所述,应谨慎对待小样本得出的结果。这个youTube视频也很好地解释了这个想法。


5
在统计中有几个众所周知的定理,即“大数定律”,但是没有一个定理看起来像问题中的那个定理。那么,如何建立连接?
whuber

3
来自Wikipedia en.wikipedia.org/wiki/Law_of_large_numbers,“根据法律,从大量试验中获得的结果平均值应接近预期值,并且随着进行更多试验而趋于接近” 。小样本的结果可能比大样本的结果离期望值更远。因此,正如问题中所述,应谨慎对待小样本得出的结果。
伊万·菲布斯

6
很好的解释,谢谢。尽管您写对了,要使法律受到信任应该谨慎对待“大量试验”是正确的,但该应用程序直观上是合理的。我想建议您的解释属于您的答案,在此答案中,您的解释应被广泛阅读和赞赏,而不是发表评论。仅链接的答案(例如您与Youtube的链接)没有解释,在这里不会持续存在。
ub

6

我们正处于通过一些样本数量来估算某些人口数量的情况。在这种情况下,我们使用样本比例来估计人口比例,但是原理要笼统得多。

10101

随着我们获取越来越多的样本(使用随机抽样),样本均值将趋于收敛于总体均值。(这是大量定律。)

但是,我们真正想知道的是我们可能有多远(例如,可以用该比例的置信区间的宽度表示,或者用误差范围表示,通常为该宽度的一半) 。

1个20

样本均值分布的标准偏差是一种测量样本均值与总体均值之间的典型距离的方法,该距离正在减小(随着增加而减小1个ñ

结果,当样本量很大时,我们对估计的准确性更有信心-如果我们再次重复实验,其他这样的方法将接近当前方法-它们越来越紧密地聚集在一起,并且因为(在这种情况下)我们的估计是无偏的,所以它们围绕我们试图估计的值聚集在一起。单一样本均值变得越来越有关于人口均值可能在何处的信息。


4

根据统计数字的经验法则是,计数的误差幅度大约是平方,例如,计数喜欢橘子的人数,或者由于放射性衰变而在盖革计数器中计算“点击”次数, -预期计数值的根。计数统计是泊松统计。

6的平方根为2.4-ish,因此误差幅度约为40%(2.4 / 6)。600的平方根是24-ish,因此误差幅度约为4%(24/600)。这就是为什么计算600比计算6更重要的原因。相对误差是十分之一。

我对误差幅度的定义有些草率。它实际上是1的西格玛值,并不是一个硬性的分界线,但这是您期望最多(68%)的测量值所在的范围。因此,如果您希望有6个吃橙子的人,那么可以期望进行一系列民意测验,使您获得的数字大多位于4到8之间,例如6,6,5,6,7,2,4,6,3,5,6, 6,7,6,10,8,6,5,6,6,9,3,7,8。


3

我没有您要查找的名字,但问题不在于统计。从心理上讲,人类在大脑中处理数字的方式赋予较大的数字更大的权重(权威),而不是较小的数字,因为大小(物理尺寸)在视觉上与代表值一样重要。因此,600/1000比6/10更可信。这就是为什么购物者更喜欢看到“ 10%的折扣!”的原因 值小于100并“节省$ 10!” 对于超过100的值(称为“ 100的规则”)。这是关于我们的大脑对感知的反应。

尼克·科伦达(Nick Kolenda)在其在线专着《定价心理学的巨大指南》中讨论了对此现象和类似现象的惊人观察。


2
尽管其他答案并非正确,但我看不到它们实际上是正确地解决了引用的文本。本文讨论的是提出数字和感知准确性的影响,而不是如果数字实际上更准确。也就是说,您可以说出600分(即1000分之一)或60%,让一个人感知到您的信息更重要,或者您可以说出10分之6,从而使您的信息显得不那么重要,即使每个人都暗示着较小的样本也意味着同一件事大小,如果没有实际说明,甚至可能是真的。
dlb

1
在我看来,这个例子从根本上来说是有缺陷的。例如,购买100可获得90的%10折扣,而购买100.01可获得75.01的25折扣,结果价格相差很大。实际上,直到您获得250.05(或250.10,取决于四舍五入或截断),值才有所不同。问题是关于样本量和标准误差,而您的示例更多是由于我们的理解而导致的实际差异。
乔W

@Joe W,虽然我无法说出“ 100条规则”的具体内容(不是心理学家),但我的回答是要指出的是,心理学家已确定人们信任更大的数字,而不是因为数字更大它代表了样本数量,但是由于人们认为更大数量的重要性更为重要。作为工程师,我宁愿不是这样---而是人的思维方式。如果您想挑战这一点,我建议您阅读Kolenda先生的演讲的基本细节。
JBH

您错过了我的观点,10%与100和25之间的差异更大,这不仅仅是感知问题。一个简单的事实是,如果你在100把两个值有15%的差异这是更简单讲两个不同样本的10之一,1000一个当测量当时的标准误差值
乔W¯¯

我更改了问题以使用10%和$ 10来帮助您。“ 100规则”的意义在于,人们认为更大的数字具有更大的相关性,并且认为货币价值比仅仅一个百分比更为重要。对于OP而言,这是一个超出讨论范围的问题。
JBH

3

尽管实际的误差范围很重要,但听起来更有说服力的原因是因为人们对体验的体验(经验法则)更强。实际的误差范围证实了这种启发式方法的优点。

如果样本的赞成票数为6,反对票数为4,则如果一个人改变投票或一个人被错误记录,则投票率为50/50。6边只有两个人。每个人都知道两个薄片,每个人都知道样本可能是精心挑选的:您只问女服务员,没有人问。或者,您只在大学礼堂中对10位大学教授进行了投票。或者,您问了萨克斯第五大道(Saks Fifth Avenue)外的10个富人。

即使是数学上的误差范围也假定了真正的随机性,并且没有考虑选择偏差,自选偏差或其他任何因素,人们可以直观地理解这一点。

相比之下,“ 600对比400”的结果是,一侧的人数比另一侧的人数多200,因此必须改变主意的人数为100。很难(但并非不可能)获得这些数字,这是偶然的原因,例如您在哪里进行投票,如何让人们达成共识,个人如何理解或解释问题等等。

更具说服力的原因不是因为它应该是数学上的证明,而是因为我们从经验中知道,与10人一组相比,1000人的人群(在任何事情上)的看法更有可能是不同的(除非您秘密地做过)您在政党代表大会或KKK集会上进行的民意测验或其他可能吸引单方面人群的投票)。

数学只能凭直觉准确地量化我们已经知道的东西;相较于随机地遇到1000中的100或200的流失选票,随机地遇到10中的一或两个流浪的选票要容易得多。


3

尚未提及的是从贝叶斯角度看问题。

pp

pËŤ一种αβñØ|p一世ññp

β=αβ=α=1个pü01个

ññØñ一种=ñ-ñØ

p

p|ñØñ一种ËŤ一种ñØ+1个ñ一种+1个

pñØ/ñØ+ñ一种ñ

ñØ=6ñ一种=4

n_o = 6和n_a = 4的后验

ñØ=600ñ一种=400在此处输入图片说明

p=0.4p=0.8

请注意,尽管这些图看起来与david25272的图相似,但它们代表的东西却截然不同

pñØ

ñØp


2

简短的答案:

基本上,它更有说服力有600出1000,超过60%的10,因为,给予同等的喜好很更有可能为6出10〜随机偶然发生。

让我们做一个假设-偏爱桔子和苹果的比例实际上是相等的(因此,每个占50%)。将此称为零假设。给定这些相等的概率,两个结果的可能性为:

  • 给定一个10个人的样本,有38%的机会随机抽取6个或更多喜欢橙子的人的样本(这并不是很不可能)。
  • 以1000人为样本,十亿分之一的人中有600人或以上的人更喜欢橙子的可能性不到十亿分之一。

(为简单起见,我假设从中抽取了无限数量的样本)。


一个简单的推导

得出此结果的一种方法是简单地列出人们可以在我们的样本中合并的潜在方式:

对于十个人来说,这很容易:

考虑从无限人群中随机抽取10个人的样本,这些人群对苹果或橙子的偏好相同。在偏好相同的情况下,轻松列出10个人的所有潜在组合很容易:

这是完整列表。

r   C (n=10)    p
10  1       0.09766%
9   10      0.97656%
8   45      4.39453%
7   120     11.71875%
6   210     20.50781%
5   252     24.60938%
4   210     20.50781%
3   120     11.71875%
2   45      4.39453%
1   10      0.97656%
0   1       0.09766%
    1024    100%

r是结果数(喜欢橙子的人),C是许多人喜欢橙子的可能方式的数目,p是我们样本中许多人喜欢橙子的结果离散概率。

(p只是C除以组合总数。注意,总共有1024种方式排列这两个首选项(即2乘以10的幂)。

  • 例如,只有10人(r = 10)的方法(一个样本)才能全部喜欢橙子。对于所有喜欢苹果的人来说都是一样(r = 0)。
  • 有10种不同的组合,导致其中9种更喜欢橘子。(每个样品中都有一个不同的人喜欢苹果)。
  • 有45个样本(组合),其中2人更喜欢苹果等。

(一般我们谈论ňC R结果的组合[R从样本ñ的人。还有,你可以用它来验证这些号码在线计算器。)

此列表使我们可以使用除法给出上述概率。有21%的机会让样本中的6个人更喜欢橘子(1024个组合中的210个)。在我们的样本中获得六个或更多人的机会是38%(六个或更多人的所有样本的总和,即1024个组合中的386个)。

在图形上,概率如下所示:

二项式样本量10

随着数量的增加,潜在组合的数量迅速增加。

对于仅20个人的样本,就有1,048,576个可能的样本,所有样本的可能性均等。(注意:下面仅显示第二个组合)。

r    C (n=20)   p
20   1          0.00010%
18   190        0.01812%
16   4,845      0.46206%
14   38,760     3.69644%
12   125,970    12.01344%
10   184,756    17.61971%
8    125,970    12.01344%
6    38,760     3.69644%
4    4,845      0.46206%
2    190        0.01812%
0    1          0.00010%
     1,048,576  100%

仍然只有一个样本,所有20个人都喜欢橙子。具有混合结果的组合的可能性更大,这仅仅是因为样本中的人员还有更多的组合方法。

有偏见的样本不太可能出现,只是因为可以产生这些样本的人员组合较少:

每个样本只有20个人,因此样本中有60%或更多(12或更多)的人更喜欢橙子的累积概率下降到仅25%。

可以看出概率分布变得越来越小:

二项式样本量20

有1000人,人数庞大

我们可以将上述示例扩展到更大的样本(但是数字增长得太快,以至于无法列出所有组合),而是我计算了R中的概率:

r   p (n=1000)
1000    9.332636e-302
900     5.958936e-162
800     6.175551e-86
700     5.065988e-38
600     4.633908e-11
500     0.02522502
400     4.633908e-11
300     5.065988e-38
200     6.175551e-86
100     5.958936e-162
0       9.332636e-302

在1000人中有600个或更多的人喜欢橘子的累积概率仅为1.364232e-10。

现在,概率分布更加集中在中心周围:

[二项式样本量1000 [3]

(例如,要计算出1000人中喜欢使用橙子的dbinom(600, 1000, prob=0.5)人中有600人的概率等于4.633908e-11,而600人或以上的人的概率为1-pbinom(599, 1000, prob=0.5)1.364232e-10(小于十亿分之一)。


1

这是因为更高的数字可确保更高的准确性。例如,如果您要从地球上的任何地方捡起1000个随机人,而其中599个是男性,而10个随机人却只有6个男性,那么前者会更准确。同样,如果您假设有70亿人口,并计算男性人数,那么您会得到一个更精确的数字,这显然比只有1000人的情况更具说服力。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.