英国退欧:“离开”是否具有统计学意义?[关闭]


12

在这篇文章中,我们提出一个有关自然现象的问题,即人类试图通过计算选票来寻求决策。这个问题涉及的这种自然现象的具体事件是英国脱欧案。

注意:问题不在于政治。目的是尝试从基于观察的统计角度讨论这种自然现象。

具体问题是:

  • 问:什么是 Brexit票离开的意思吗?例如,这是否意味着公众真的想离开欧盟?这是否仅表示公众不确定,需要更多时间思考?或者是别的什么?51.9%

假设1:投票过程中没有错误。


14
民主与统计意义无关。51.9%的结果意味着51.9%的投票者投票赞成“离开”。这不是民意测验。那些不投票的人用脚投票(不投票)。解释51.9%为“公众不确定,需要更多时间思考”,这只是统计数字。Brexit发生的概率为1
蒂姆

7
该线程注定是非统计性的,自以为是的,甚至可能是辩论性的。不管它有多受欢迎,它都不适合该网站。我们有一个聊天室,里面挤满了很乐意进一步进行此类对话的人:请查看!
ub

2
我认为当前的讨论是针对统计的,并且是解释投票结果的一个很好的例子,因为它适用于统计测试。
Underminer

3
您提出了一个重要问题:民意测验(例如民意测验)的测量误差。恐怕误差的主要来源不是样本量。
Aksakal

4
恕我直言,这是一个非统计性问题,并加上了一些薄薄的统计数据来掩盖这一事实。在我读到这篇文章时,“投票过程中没有错误”这一假设消除了所有统计上的考虑,并必然将讨论引入民主中“投票……的含义”。这是政治科学和哲学问题,而不是统计问题。
ub

Answers:


17

我同意@Underminer的观点,认为没有采样错误,但这不是因为样本很大,而是因为其中没有采样。没有人被抽样投票。显然有一部分人想投票,但是却没有投票权(例如,今天发生车祸)或投票无效,但这是这里唯一的“抽样”。

结果是准确的,没有错误,因为全体人民都参加了投票(有些人不参加投票)。有些人决定投票,有些人没有投票。有些决定对休假投票,有些则没有。民主与统计意义无关,而与真正发生的事情有关。投票不是要了解人们的意见,而是要做出决定。实际上,人们有时不按照自己的想法投票,而是表现或取得成就。例如,在选举中,如果人们认为他有更大的获胜机会,则可以不投票给他们首选的候选人,而是投票给他们的第二候选人。


考虑一个灰色区域的情况,在该区域中,投票人群不太确定什么对他们有好处。例如,有2个候选人几乎相等的情况。在这种情况下,我认为那些投票的人可能会在系统上有所不同,因为我认为他们的票数可能接近统一的分配。我的目的不是要重新定义民主(一个政治话题),而是要看看我们能说出英国退欧是否是一个灰色地带?
穴居人

2
@caveman不管他们是否确定,重要的是他们如何投票,因为投票是关于实际投票。当然,有些人没有明确的意见,有些人投票,有些人没有投票,但这也没关系,因为重要的是那些投票的人的实际票数。
蒂姆

如果我理解正确,那么您的意思是关于民主如何解释选票?我同意你的看法。但是,我并不是以政治家的方式来解释它。我试图利用总体来确定一个决定是好是坏,或者不是很明确。这是投票的另一种用法。
穴居人

2
@caveman人们一直在改变主意,心理学家对此写了成千上万的论文……是的,51.9%并不意味着51.9%的英国人确实有100%肯定会离开欧盟。人们甚至可能不确定是否比较行的长度(en.wikipedia.org/wiki/Asch_conformity_experiments)...
Tim

1
@Aksakal我不会评论谁有资格投票和谁没有投票权。我也不会评论获得必要证书的难度。那是政治,因此不在这里成为话题。从统计的角度来看,每个合格的投票者都有一定的不投票的可能性。这种可能性可能受到某些因素的影响,这些因素可能与他们的喜好有关,也可能与他们的喜好无关,但是每个合格的选民都可以自行决定选择(不)行使该权利。
user3697176

9

51.9%是想离开的选民百分比。由于样本量如此之大(> 3300万),因此几乎没有随机抽样误差。

统计显着性检验将试图确定在差保持休假可以通过随机抽样误差单独解释,差异肯定会显著(见@穴居人的答案)。

这种方法的问题在于,统计意义非常强地假设样本是整个人口(整个英国)的代表,而不仅仅是投票者。

在确定是否有超过一半的英国人想“离开”时,无回应率(那些没有投票的人)非常重要,并且很难衡量。当不太可能投票的小组有系统地不同的看法时,就会产生无回应的偏见。例如,根据退出民意调查,千禧一代投票的可能性较小,但留下来的投票的可能性较大,这在试图代表整个英国的人口时会偏向结果。

因此,传统意义上的统计显着性检验很大程度上是不合适的


假设: 我们需要为其中的任何一个定义一些术语,以便避免对投票试图完成的事情进行政治讨论。这是我的定义:

人口:居住在英国的每个人

抽样框架:每个有投票资格的人都可以投票

抽样方法:自愿答复,投票行为参与了调查

示例:实际投票的个人

在这种设置中,可以使用样本比例(好坏)来估计所有倾向于保留(或离开)的人的百分比。


8

你问

51.9%的英国退欧投票意味着什么?

这意味着有51.9%的选民投票离开。

例如,这是否意味着公众真的想离开欧盟?这是否仅表示公众不确定,需要更多时间思考?或者是别的什么?

票数为 “离开”)和 “剩余”),表示合格选民未投票,约有万居民不合格。由于实际选民的集合或合格选民的集合都不是“公众”,也不是“公众”的代表(随机,无偏见,选择相关形容词),因此51.9%的英国退欧投票不会通知您第二次投票及后续问题。16174218871216146297181293135318

可能有可能针对您的问题构建调查表。这似乎并不是在全民公投中所发生的事情。


1
除了表面上的结论,即“ 51.9%的投票假 ”,您是否可以讨论相对于选民(即不是整个人口)的投票的含义?我想知道我们可以从中提取多少信息。
穴居人

4
穴居人比其他任何人都更能说明您的问题是非统计性的。因为51.9%(连同总数)构成了有关选民的所有证据,而且没有不确定性(除非您想挑战计数的准确性,这是一个单独的问题),因此您拒绝该答案意味着您正在寻找非统计结论。
ub

如果我们将英国退欧建模为二元分类问题,然后将选民视为属于整体成员的分类器的估计,该怎么办?在此模型中,目标不是识别大多数公民想要什么,而是目标是从分类器的空间中识别最佳分类器。然后,我们可以使用一些措施来测试这种基于人选的分类器集合的优劣。例如,在未知的地面真相(例如,我们显然不知道休假是否比休假更好)的情况下,我们可能会使用“困惑”或其他适合此二进制分类任务的方法。
穴居人

@caveman:鉴于基本事实是(正确地)未知,您将使用什么度量来“从分类器空间中识别最佳分类器”?任何此类度量标准都会对选择该度量标准的分析人员的偏见进行编码,但度量标准“再现投票结果”除外,对于该度量标准,您已经知道答案:51.9%/ 48.1%。
埃里克·塔

@EricTowers我已经采取了这politics.stackexchange.com,我谈到了不同的方法- politics.stackexchange.com/questions/11433/...
穴居人

2

TL; DR

R=100051.9%51.9%

0

也许是多余的,但我也做了同样的事情,但仍然需要衡量这种可能性48.1%

0

因此,我得出的结论是,英国脱欧公投不是不确定混乱的人群的嘈杂副作用。似乎有系统的原因促使他们离开欧盟。

我在这里上传了模拟器代码:https : //github.com/Al-Caveman/Brexit

细节

给定 假设1,可能的答案(或假设)为:

  • H0公众不确定
  • H1信心离开

注意:这是不可能的,公众满怀信心保持,因为我们已经排除了投票错误。

H0H1

  • 51.9%
  • 151.9%

H1H0

为了衡量这种可能性,我们需要知道 英国脱欧这样的二元投票系统中不确定的英国人口。因此,我的第一步是按照以下假设模拟此分布:

  • 假设2:不确定的个体组成的总体将获得随机机会投票。即,每个可能的答案都有相等的机会被选择。

我认为这一假设是公平/合理的。

此外,我们为请假建模留任活动为两个不同的过程,如下所示:

  • PleaveOleave=[l1,l2,,ln]
  • PremainOremain=[r1,r2,,rn]

哪里:

  • n
  • i{1,2,,n}li,ri{0,1}01意义某一投票投票为相同的处理。

受到以下约束:

  • i{1,2,,n}liri1li=1ri=0ri=1li=0i{1,2,,n}停留

Oleave=[1,0,0]3离开

Oremain=[0,1,0]3

Oleave[3]=Oremain[3]=0

33,568,18451.9%10051.9=48.1%

  • n=33,568,184
  • 33,568,184×0.519=17,421,887.496
    i=133,568,184Oleave[i]=17,421,887.49617,421,887
  • 33,568,184×(10.519)=16,146,296.504
    i=133,568,184Oremain[i]=16,146,296.50416,146,297

因此,我们将输出数组定义如下:

  • i{1,2,,17421887}Oleave[i]=1
  • i{17421887+1,17421887+2,,33568184}Oleave[i]=0
  • i{1,2,,17421887}Oremain[i]=0
  • i{17421887+1,17421887+2,,33568184}Oremain[i]=1
  • i{1,2,,33568184}Ounsure,m[i]=CC{0,1}mOunsure,mOunsure,mOunsure,1=Ounsure,20.533,568,184

pleave

pleave=1Rm=1R{1if (i=133,568,184Oleave[i])(i=133,568,184Ounsure,m[i])0else
ROunsure,m 被定义为。

premain

premain=1Rm=1R{1if (i=133,568,184Oremain[i])(i=133,568,184Ounsure,m[i])0else

R=1,000

total leave votes: 17421887
total remain votes: 16146297
simulating p values............ ok
p value for leave: 0.000000
p value for remain: 0.000000

换一种说法:

  • pleave=0
  • premain=0

2
在这种情况下,也许更重要的是无回应率(即不投票的个人)。误差幅度(或统计显着性度量)仅考虑随机样本误差。无响应偏差不包括在其中,并且与具有如此大样本量的民意测验相比,随机抽样误差的影响要大得多。
Underminer

46,499,53746,499,537(17421887+16146297)=12,931,353

3
没有统计上令人满意的方法来处理非随机缺失数据。
Underminer

那些没有投票的人可以由那些不在乎政治(例如不再信任)的人组成。另外,那些不确定的人可能是这样的投票者。或者,可能是两者的混合。如果我们假设“ 所有投票者都不确定 ”会怎样?这是检验当前状况是否是公众感到英国退欧是一个灰色地带的上限吗?
穴居人

3
这里对统计的性质和范围感到困惑。您正在尝试创建一个投票过程模型,以及该模型如何告知治理和公共决策的机制和有效性。这是政治学中一项值得完成的任务。它根本不是统计信息(尽管涉及统计信息)。
gung-恢复莫妮卡

1

您可能会问一个稍微不同的问题:假设非常大的人群中有50%的人投了赞成票,并问了一个随机数为S的样本,那么有51.9%的样本对“是”的概率是多少,具体取决于样本量?

S1/2。实际数与预期的“是”票数之间的偏差超过6.1个标准偏差时,就有十亿分之一的机会。

S1/2(6.10.5/0.019)2


0

这是使用解析方法而不是模拟的另一种解决方案。

n0.5

51.9%17,421,887Oleave0.533,568,18417,421,887+10.533,568,184

17,421,887

i=17,421,88733,568,1840.533,568,184=(33,568,18417,421,887)×0.533,568,184=8.39663381928984×10101050240

Wolframalpha计算)8.39663381928984×1010105024

这是具有概率的的不确定人口投票休假51.9%

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.