在这篇文章中,我们提出一个有关自然现象的问题,即人类试图通过计算选票来寻求决策。这个问题涉及的这种自然现象的具体事件是英国脱欧案。
注意:问题不在于政治。目的是尝试从基于观察的统计角度讨论这种自然现象。
具体问题是:
- 问:什么是 Brexit票离开的意思吗?例如,这是否意味着公众真的想离开欧盟?这是否仅表示公众不确定,需要更多时间思考?或者是别的什么?
假设1:投票过程中没有错误。
在这篇文章中,我们提出一个有关自然现象的问题,即人类试图通过计算选票来寻求决策。这个问题涉及的这种自然现象的具体事件是英国脱欧案。
注意:问题不在于政治。目的是尝试从基于观察的统计角度讨论这种自然现象。
具体问题是:
假设1:投票过程中没有错误。
Answers:
我同意@Underminer的观点,认为没有采样错误,但这不是因为样本很大,而是因为其中没有采样。没有人被抽样投票。显然有一部分人想投票,但是却没有投票权(例如,今天发生车祸)或投票无效,但这是这里唯一的“抽样”。
结果是准确的,没有错误,因为全体人民都参加了投票(有些人不参加投票)。有些人决定投票,有些人没有投票。有些决定对休假投票,有些则没有。民主与统计意义无关,而与真正发生的事情有关。投票不是要了解人们的意见,而是要做出决定。实际上,人们有时不按照自己的想法投票,而是表现或取得成就。例如,在选举中,如果人们认为他有更大的获胜机会,则可以不投票给他们首选的候选人,而是投票给他们的第二候选人。
51.9%是想离开的选民百分比。由于样本量如此之大(> 3300万),因此几乎没有随机抽样误差。
统计显着性检验将试图确定在差保持和休假可以通过随机抽样误差单独解释,差异肯定会显著(见@穴居人的答案)。
这种方法的问题在于,统计意义非常强地假设样本是整个人口(整个英国)的代表,而不仅仅是投票者。
在确定是否有超过一半的英国人想“离开”时,无回应率(那些没有投票的人)非常重要,并且很难衡量。当不太可能投票的小组有系统地不同的看法时,就会产生无回应的偏见。例如,根据退出民意调查,千禧一代投票的可能性较小,但留下来的投票的可能性较大,这在试图代表整个英国的人口时会偏向结果。
因此,传统意义上的统计显着性检验在很大程度上是不合适的。
假设: 我们需要为其中的任何一个定义一些术语,以便避免对投票试图完成的事情进行政治讨论。这是我的定义:
人口:居住在英国的每个人
抽样框架:每个有投票资格的人都可以投票
抽样方法:自愿答复,投票行为参与了调查
示例:实际投票的个人
在这种设置中,可以使用样本比例(好坏)来估计所有倾向于保留(或离开)的人的百分比。
你问
51.9%的英国退欧投票意味着什么?
这意味着有51.9%的选民投票离开。
例如,这是否意味着公众真的想离开欧盟?这是否仅表示公众不确定,需要更多时间思考?或者是别的什么?
票数为 “离开”)和 “剩余”),表示合格选民未投票,约有万居民不合格。由于实际选民的集合或合格选民的集合都不是“公众”,也不是“公众”的代表(随机,无偏见,选择相关形容词),因此51.9%的英国退欧投票不会通知您第二次投票及后续问题。161218
可能有可能针对您的问题构建调查表。这似乎并不是在全民公投中所发生的事情。
也许是多余的,但我也做了同样的事情,但仍然需要衡量这种可能性
因此,我得出的结论是,英国脱欧公投不是不确定或混乱的人群的嘈杂副作用。似乎有系统的原因促使他们离开欧盟。
我在这里上传了模拟器代码:https : //github.com/Al-Caveman/Brexit
给定 假设1,可能的答案(或假设)为:
注意:这是不可能的,公众满怀信心要保持,因为我们已经排除了投票错误。
为了衡量这种可能性,我们需要知道 英国脱欧这样的二元投票系统中不确定的英国人口。因此,我的第一步是按照以下假设模拟此分布:
我认为这一假设是公平/合理的。
此外,我们为请假建模和留任活动为两个不同的过程,如下所示:
哪里:
受到以下约束:
到离开。
因此,我们将输出数组定义如下:
total leave votes: 17421887
total remain votes: 16146297
simulating p values............ ok
p value for leave: 0.000000
p value for remain: 0.000000
换一种说法:
您可能会问一个稍微不同的问题:假设非常大的人群中有50%的人投了赞成票,并问了一个随机数为S的样本,那么有51.9%的样本对“是”的概率是多少,具体取决于样本量?
。实际数与预期的“是”票数之间的偏差超过6.1个标准偏差时,就有十亿分之一的机会。