2016年美国大选结果:预测模型出了什么问题?


108

首先是英国脱欧,现在是美国大选。许多模型预测大都偏离了,这里有教训可学吗?截至太平洋标准时间(PST)昨天下午4点,博彩市场仍以4比1的优势吸引了希拉里。

我认为,有真实货币的博彩市场应该充当那里所有可用预测模型的集合。因此,说这些模型做得并不好是不为过的。

我看到一个解释是,选民不愿将自己确定为特朗普的支持者。模型如何包含这样的效果?

我读到的一个宏观解释是民粹主义的兴起。那么问题是统计模型如何捕获这样的宏观趋势?

这些预测模型是否过多地强调了民意测验和情绪数据,而从该国100年的角度来看,这些数据还不够?我引用朋友的评论。


9
如何估算“不愿意将自己确定为特朗普的支持者”。效果:也许是焦点小组?与统计本身相比,这更是一个社会科学问题。
kjetil b halvorsen '16

100
为什么模型仅仅因为预测了未发生的结果而必须出错?我有一个模型,说骰子可能不会显示六个,但有时还是显示六个。
dsaxton,2016年

4
我不确定这些模型是否真的严重偏向错误的一面。我们是否正确读取模型的输出?我也同意dsaxton的评论。
理查德·哈迪

7
在安德鲁·盖尔曼的博客有些善念这里
理查德·哈迪

22
如果赔率是4:1,则不太常见的结局仍应经常发生。那就是投注市场很可能是正确的。
gung

Answers:


57

简而言之,轮询并不总是那么容易。这次选举可能是最艰难的。

所有我们正在尝试做统计推断的时候,一个根本的问题是我们的样品是否是感兴趣的人群的一个很好的代表。许多类型的统计推断都需要一个典型的假设,即让我们的样本是来自目标群体的完全随机样本(并且通常,我们还需要样本独立)。如果这些假设成立,那么根据统计理论,我们通常可以很好地衡量我们的不确定性。

但是我们绝对没有这些假设在民意测验中成立!我们的感兴趣人口中有0个样本:选举日的实际票数。在这种情况下,如果没有关于数据的进一步,不可测的假设,我们将无法做出任何有效的推断。或者至少直到选举日之后才能测试。

我们是否完全放弃并说“ 50%-50%!”?通常没有。我们可以尝试对投票方式进行合理的假设。例如,也许我们想相信民意测验是选举日投票的无偏估计,加上某些特定的无偏见的时间噪声(即,随着时间的流逝,不断演变的公众舆论)。我不是轮询方法方面的专家,但是我相信这是538使用的模型的类型。在2012年,它运作良好。因此,这些假设可能非常合理。不幸的是,除了严格的定性推理之外,没有任何真正的方法可以评估这些假设。有关类似主题的更多讨论,请参见不可忽略的缺失主题。

我的理论解释了为什么民意调查在2016年的表现如此糟糕:民意调查并不是对选民日行为的无偏估计。也就是说,我猜想特朗普的支持者(可能还有英国脱欧的支持者)对民意测验者的信任度要高得多。请记住,特朗普先生积极谴责民意调查。因此,我认为特朗普的支持者比他的反对者更不可能向民意测验者报告投票意向。我推测这在民意测验中造成了无法预料的严重偏见。

分析人员在使用民意调查数据时如何解释这一点?仅基于民意测验数据,没有真正的方法可以以定量的方式做到这一点。投票数据不会告诉您任何未参加的人。但是,通过选择关于投票数据与选举日行为之间关系的更合理(但无法检验)的假设,人们可以通过定性的方式改进民意测验。做一个好的民意测验是不平凡的,真正困难的部分(注意:我不是民意测验员)。还要注意,结果也令专家们感到非常惊讶,因此,这似乎并没有明显迹象表明这一假设已大为偏离。

轮询可能很困难。


1
@horaceT:在从感兴趣的人群中取样之前,他们怎么会知道存在偏差?从历史上看,这里的皱纹之一是,我想这个问题是噪音而不是偏见之一。如果双方的平等程度相同,那么您的估计将是无偏见的,只会稍微多一点噪音。但是由于特朗普先生竞选时对媒体报道和民意调查持严重否定意见,比以往任何一次选举都严重得多,因此不回应可能很容易在代表特朗普选票的情况下变得偏颇。这将是民意测验人员会产生的影响...
Cliff AB

38
对于它的价值,我仍然认为538并没有真正失败。这给特朗普赢得了大约30%的机会(?),这真是太好了-这意味着每2-3倍预期是正确的,它就会错1次。这是巨大的不确定性,远远超过其他民意调查似乎愿意接受的不确定性。
Mehrdad

3
这种效应是众所周知的:在美国称为Bradley效应,在英国称为Shy Tory效应。
Emilio Pisanty

15
538(以及其他类似Sam Wang的PEC的东西)不是民意调查。它们是根据民意调查结果构建的模型。所有这些模型都从基本相同的数据开始,但是538预测结果会有更多不确定性,原因是Nate Silver广泛讨论了选举前的原因。这意味着即使使用相同的民意测验,希拉里获胜的538机会也要低得多。我同意538并没有失败-考虑到它的投入,即使在事后看来,希拉里(Haryary)赢得很多不确定因素似乎也是最好的预测。
2016年

6
我首先阅读大选后第二天的538个最终预测,内特·西尔弗(Nate Silver)很清楚地指出,通常范围内的误差幅度为3%-如果您查看他的误差范围为3%的图表,在特朗普的支持下,它与实际发生的情况非常吻合。
熊加米奥夫

35

有许多轮询错误源:

  • 您发现有些人难以到达

    可以通过进行人口统计分析,然后针对您的抽样偏差进行校正。如果您的人口统计分析没有反映出让人难以接近的事物,则此更正将无法修复损坏。

  • 人们撒谎

    您可以使用人们撒谎的历史汇率来影响您的模型。例如,从历史上讲,人们说他们将在选举日投票给第三党的人数比实际多得多。您的更正在这里可能是错误的。

    这些谎言也可能使您的其他改正变得混乱。如果他们在上次选举中撒谎,例如,即使他们不是,他们也可能算作可能的选民。

  • 只有投票的人最终计数

    有人可以得到很多支持,但是如果他们的支持者在选举日没有出席,那就不算什么。这就是为什么我们注册了选民,可能的选民等模型的原因。如果这些模型是错误的,那么事情就不起作用了。

  • 轮询会花钱

    进行民意调查的成本很高,而且如果您不希望密歇根州发生翻转,您可能不会经常进行民意调查。这可能会使您感到惊讶,因为您在选举前三周对州进行的选举看起来与选举日的情况完全不同。

  • 人们改变主意

    在几分钟,几小时,几天,几周或几个月的时间内,人们都会改变主意。如果他们在改变之前改变主意,则对“您现在将要做的事情”进行轮询并没有太大帮助。有些模型可以根据历史民意大致猜测人们改变主意的速度。

  • 放牧

    如果其他所有人都说希拉里为+3,而您得到的调查显示希拉里+11或唐纳德+1,您可能会对此表示怀疑。您可能会再次通过,以查看是否存在分析失败。您甚至可以将其丢弃,然后再进行一次民意调查。当您获得希拉里的+2或+4民意调查时,您可能不会这样做。即使统计模型表示有时会发生大规模异常值,也会使您“看起来很糟糕”。

    特别糟糕的是,这发生在选举日,每个发表民意测验的人都神奇地汇聚到了相同的价值。他们可能在离群调查中投票,但没人愿意成为大选前一天说(说)希拉里+11的人。在群中犯错对您的伤害较小。

  • 预期采样误差

    如果您有100万人,并且问100个完全随机的人,一半说“ Apple”,另一半说“ Orange”,则即使上述任何一个问题,您从采样中得到的预期误差都是+/- 10左右发生。这最后一位是什么民意调查形容为自己的误差幅度。民意测验很少描述上述校正因子会导致什么错误。


538岁的内特·西尔弗(Nate Silver)是为数不多的使用保守(谨慎)手段处理上述类型错误的可能性的聚合器之一。他考虑了投票模型中系统相关错误的可能性。

当其他选民们预测选出HC的机会超过90%时,内特·西尔弗(Nate Silver)则表示有70%的机会当选,因为民意调查在唐纳德大选中获胜的“正常民意调查错误”之内。

与原始统计抽样误差相比,这是对模型误差的历史测量;如果模型和模型修正错误,该怎么办?


人们仍在处理数字。但是,初步结果表明,其中很大一部分是投票率模型。与投票模型(和退出民意调查!)所显示的相比,唐纳德支持者所占比重更大,希拉里支持者所占比重更低。

拉丁美洲人对唐纳德的投票超过了预期。黑人对唐纳德的投票超过了预期。(大多数人都投票支持希拉里)。白人妇女对唐纳德的投票比预期多(其中投票给唐纳德的人数多于希拉里,这是出乎意料的)。

投票率普遍较低。当选民投票率很高时,民主党倾向于赢得选举;当选民投票率较低时,共和党倾向于赢得选举。


1
一个有趣的投票率问题是投票本身会影响投票率。是否有投票率模型?应该有可能具有接受调查预测投票率的功能,并根据候选前景对双方进行修改。远远落后的候选人在看到民意测验将候选人的前景描述为可怕之后可能不会引起更多关注的选民,但是如果您的候选人遥遥领先,那么您可能不会努力地投票出去...显然,这不是一个线性函数,但是它应该是可测量的。

2
从我这里+1只是为了提及牧群并很好地解释它。在回答问题时,根据538图,我非常可疑的放牧可能是在大约5点左右(选举后3天)开始发生。我猜我们会在接下来的日子里找到更多有关错误的真正信息。(当您沉迷地刷新网页以考虑在那里的图形曲线的二阶导数时,您就知道自己是一个书呆子)。
TED

我不知道您怎么解释,但我认为与特朗普相关的污名使他难以正确量化他的实际支持,只会出现在实际选举结果中。我喜欢将其视为保险杠贴纸的推论:乔治·W·布什和奥巴马都是两个任期总统,但是当奥巴马的保险杠贴纸广泛使用并以骄傲的汽车装饰时,布什的保险杠贴纸就像是四叶草。在某些候选人中,公开支持会从反对派那里吸收过多的热量和硫酸,而支持则非常低调。
coburne

3
@coburne在初选阶段没有任何证据。特朗普的支持者对此并不害羞。布什的保险杠贴纸在不同的地方比奥巴马的保险杠贴纸流行。
Yakk

@coburne-您所说的被称为“布拉德利效应”。关于它是否存在,存在着巨大的争论。尽管有一项研究据称发现其力量与竞选中使用种族歧视的言论大致成比例。我不认为有很多争论是在这一讨论中使用的。
TED

31

在接受的答案的评论中提到了这一点(Mehrdad的建议),但我认为应该强调这一点。538其实这样做非常好这个周期 *

538是一个轮询聚合器,它针对每个州运行模型以尝试预测获胜者。他们的最后一轮比赛给了特朗普大约30%的获胜机会。这意味着,如果您使用这样的数据进行了三场选举,您会期望Red Team赢得其中之一。这确实不是一个很小的机会。它肯定足够我采取预防措施(例如:在我要求第9个星期三下班前的那个星期五,考虑到它可能足够接近深夜)。

538会告诉您,如果您在外面闲逛,那就是如果民意调查关闭,则很有可能它们都朝着同一方向进行。这有两个原因。

  • 可能的选民模型。民意测验必须针对实际将在选举日出现的选民类型进行调整。我们有历史模型,但是显然这不是您的典型候选人,因此根据过去的数据进行预测总是有些麻烦。
  • 后期选举成群。没有人愿意成为使选举最糟糕的民意测验。因此,尽管他们不介意在竞选活动中成为离群值的人,但最终所有民意调查都会调整自己,以便他们说相同的话。这是的事情之一是被指责的投票是在埃里克康托尔的意外损失这么严重过在2014年,而对于的令人惊讶的接近结果2014弗吉尼亚州参议院竞选为好。

*-538现在已经发布了自己的分析。它主要与上述内容相吻合,但是如果您需要更多细节,则值得阅读。


现在有点个人猜测。实际上,我对538最近3天的最终%机会表示怀疑。原因可以追溯到上面的第二个项目符号。让我们看看他们这次选举的模式历史(从他们的网站)

在此处输入图片说明

(可悲的是,标签使它模糊不清,但是在此之后的最后三天,曲线又出现了分歧,克林顿的机会超过了70%)

我们在这里看到的模式是反复发散,然后衰减回特朗普领导。克林顿泡沫都是由事件引起的。首先是惯例(通常在事件开始后会出现几天的延迟,以便开始出现在投票中)。第二次辩论似乎已经开始了第二次辩论,很可能是TMZ录音带对此有所帮助。然后是我在图片中标记的第三个拐点。

它发生在选举前三天的11月5日。是什么原因造成的?在此之前的几天,这又是一次电子邮件激增,但这不应该对克林顿有利。

当时我能提出的最好的解释是民意调查。距离选举只有3天,距离最终投票只有2天,民意测验人员将开始担心他们的最终选举结果。整个选举中的“常规智慧”(由博彩模型证明)是克林顿轻松获胜。因此,这似乎根本不是真正的拐点。如果真是这样,那么11月5 日之后的真实曲线很可能是这一趋势趋于收敛的延续。

如果没有这个可疑的最终拐点,需要一个比我更好的数学家来估计此处的曲线,但是我认为11月8日将在交叉点附近。前面还是后面取决于该曲线的实际数量。

现在我不能肯定这是怎么回事。还有其他非常合理的解释(例如:特朗普让他的选民比任何民意测验的人都要好得多),但这是我当时理论的理论,并且肯定可以预测。


1
我认为过去几天这种怪异的民意调查拐弯本可以得到更好的分析,但是克林顿的支持者看到了他们想看到的东西,而特朗普的支持者早就退出了对民意调查的关注。希望有人现在就做。
TED

我以为,由于Comey声明新电子邮件构成重新进行刑事调查的原因,因此最后几天稍有恢复。
康拉德·鲁道夫

@KonradRudolph-那是我当时听到的关于这种变形的解释。问题在于,直到11月6日才发表有关声明,可疑的投票拐点发生在一天之前(请参见上图中的标记)。同样,由于下降的时机不对,因为Comey完全解释了下降的原因,因此没有逻辑上的理由表明他的“ nevermind”声明会阻止它(更不用说转身了)。
TED

2
538的问题不仅在于其模型,还在于进入其中的轮询数据的质量。数据清楚地表明,这不是抽样错误的情况(当您对每个民意测验均具有不错样本量的民意调查进行平均时,这是很小的)。washparkprophet.blogspot.com/2016/11/what-polls-got-wrong.html相反,问题要么是民意调查的最大比例偏向抽样,要么是民意调查者的系统性不实(由于特朗普的社会反对)或都。但是,538因在其模型中认识到不同州的民意测验不是独立的而倍受赞誉。
ohwilleke '16

@ohwilleke-对。正如其他答案之一所说,GIGO。这就是我认为可能发生的那个奇怪的无法解释的拐点。问题是输入民意调查中“垃圾”的来源。
TED

17

首先是英国脱欧,现在是美国大选

并非第一次,例如2002年法国总统大选 “就引发了有关投票技术的认真讨论”。

因此,说这些模型做得并不好是不为过的。

垃圾进垃圾出。

我看到一个解释是选民不愿意将自己确定为特朗普的支持者。模型如何包含这样的效果?

请参见回应偏见,尤其是社会期望偏见。其他有趣的读物:沉默多数布拉德利效应


2
当然,垃圾在垃圾里了。但是,如何识别预测变量是垃圾,如何通过“变量选择”来获取预测变量呢?
horaceT

6
如您所见,@ horaceT 非常困难,有时甚至是不可能的。FiveThirtyEight.com拥有非常不错的方法论和高质量模型,使用多种数据并纠正多重偏差。选举的前一天,希拉里·克林顿(Hilary Clinton)获胜的概率为71.4%
蒂姆

1
@horaceT我将专注于数据收集,因为这似乎是个问题。社会可取性偏好页面包含一些改进建议。
Franck Dernoncourt,2016年

1
此外,如果@horaceT几乎每个人都说克林顿只领导一个疯子,他们会争辩说他们都错了……很难证明这种模式是正确的。
蒂姆

1
我想知道民意测验对选民投票的预测有多准确(例如基于人口统计)。我可以想象,如果许多民意测验预测“领先”,投票率可能会受到抑制(例如类似于观察者效应)?
GeoMatt22 '16

12

南加州大学/洛杉矶时报的民意测验有一些准确的数字。他们预测特朗普将处于领先地位。请参阅《南加州大学/洛杉矶时报》的民意调查,了解其他调查遗漏了什么:一波特朗普的支持

http://www.latimes.com/politics/la-na-pol-usc-latimes-poll-20161108-story.html

在此处输入图片说明

他们也有2012年的准确数字。

您可能需要查看:http : //graphics.latimes.com/usc-presidential-poll-dashboard/

纽约时报抱怨他们的权重:http : //www.nytimes.com/2016/10/13/upshot/how-one-19-year-old-illinois-man-is-distorting-national-polling-averages。 html

洛杉矶时报的回复:http : //www.latimes.com/politics/la-na-pol-daybreak-poll-questions-20161013-snap-story.html


26
这项民意调查显示,特朗普以3.2%的票数赢得了普选,但克林顿似乎以0.1%的票数获胜。所以我看不出你怎么能说他们有准确的数字。
温斯顿·埃韦特

3
请注意-您真的希望任何统计信息都在错误窗口的3.2%以内吗?
AnoE

9
以该民意测验为例,存在以下问题:1)轮询错误的事物。民众投票与赢得总统职位有关,但这不是其决定的方式。2)顶线错误。克林顿赢得了衡量的结果,而不是特朗普。3)大多数其他民意测验都朝着相同的3ish点走,只是方向不同。
TED

5
...实际上,似乎克林顿在全民投票中可能比特朗普领先整整一个百分点,这意味着该民意调查的得分是4,而不是3。过两倍准确(由仅2个而不是4关闭),因为这一个。
TED

8
《洛杉矶时报》的民意调查是偶然的,是正确:体重过重的19岁老人平衡了体重不足的白人农村选民。
标记

11

这里没有高地要求。我从事的领域(监控和评估)与伪科学一样泛滥,就像您可以命名的任何其他社会科学一样。

但是,这是一笔交易,据称当今的投票业处于“危机”中,因为它使美国大选的预测如此错误,社会科学总体上具有可复制性的“危机”,而在2000年代后期,我们曾发生过世界金融“危机”,因为一些从业者认为,次级抵押贷款衍生品是一种有效的财务数据形式(如果我们给他们带来疑问的好处……)。

而且我们所有人都犯了错误。我每天都看到最可疑的研究人员构造被用作数据收集方法,并最终被用作数据(从准标准量表到绝对领先的固定响应类别的所有数据)。几乎没有研究人员似乎意识到他们需要对这样的结构有一个概念框架,然后他们才希望了解他们的结果。好像我们已经研究了市场“研究”方法,并决定只采用最糟糕的错误,同时还增加了一些数字方法。

我们想被认为是“科学家”,但是严酷的环境太难了,以至于无法理,,因此我们收集垃圾数据,并向类似洛基族的统计之神祈祷,以神奇的方式超越GIGO公理。

但正如费曼先生所引述的那样:

“您的理论有多么美丽并不重要,您的聪明程度也不重要。如果不同意实验,那就错了。”

有很多更好的方法可以处理我们经常遇到的定性数据,但是它们需要花费更多的工作,而那些好的研究人员构造通常更易于输入SPSS。每次便利似乎都比科学要重要(没有双关语)。

简而言之,如果我们不开始认真对待原始数据质量,那么我认为我们只是在浪费每个人的时间和金钱,包括我们自己的时间和金钱。因此,是否有人愿意就社会科学方法开展“数据质量倡议”方面的合作(是的,教科书中有很多关于此类问题的资料,但似乎没人在考试后关注该资料)。

具有最高学术水平的人将成为领导者!(不会是我。)

只是为了清楚我在这里的答案:我经常看到“人为”原始数据类型存在严重的基本问题,因此我建议需要从头开始。因此,即使在我们担心采样或对数据执行哪些测试之前,我们也需要查看与所建议的模型相关的数据类型的有效性/局限性。否则,整个预测模型将无法完全定义。


2
我敢肯定,可以肯定地说,您能举一些有问题的研究人员构想的例子吗?
horaceT '16

4
我不一定同意您的很多观点。但是我只想指出,在轮询的情况下,我认为每个轮询者都非常了解数据质量所带来的局限性,但实际上没有任何选择可以改进它(请参见我的回答)。您的答案似乎暗示民意测验人员想提出任何答案,而不是关心数据质量。我认为民意测验人员非常在意数据质量,但同时也意识到,他们所能获得的最好结果具有严重的潜在缺陷。您是否放弃(“ 50%-50%!”)或尝试构建可能合理的东西?
悬崖AB

我对评论的回复肯定有点长,因此将其添加为新答案
colin 2016年

9

民意测验的误差幅度通常为5%,这是您无法真正摆脱的,因为它不是随机误差,而是偏差。即使您对许多民意测验进行平均,也不会变得更好。这与选民团体代表不当,缺乏动员,无法在工作日参加投票,不愿意回答,不愿意回答正确,自发的最后决定……有关,因为这种偏见往往是“相关的”在所有民意调查中,您无法通过更多民意调查摆脱它;您也无法摆脱更大样本量的困扰;而且您似乎也无法预测这种偏见,因为它的变化太快了(我们很少选举总统)。

由于几乎在所有州都仍然存在愚蠢的赢家通吃原则,因此5%的误差导致非常不同的结果:假设民意调查始终预测为49-51,但实际结果为51-49(因此,误差为仅2%),结果是100%折扣;因为赢家全取。

如果查看各个状态,则大多数结果都在预测的误差范围内!

您可能要做的最好的办法就是对这种偏差进行抽样(+ -5%),应用获胜者通吃的所有极端方法,然后汇总结果。这可能类似于538所做的;在30%的样本中,唐纳德·特朗普赢得了...


9
我将此称为民意调查的“疯狂边缘原则”:在任何调查问题中,所有受访者中有5%会给出疯狂的答案。 像任何经验原则一样,它也有例外,但几十年来它在帮助理解民意测验结果方面表现良好。
ub

1
我只希望只是一个“疯狂”的答案。问题在于它是系统的而不是“随机的疯狂”。您可以将这次选举视为一次二进制民意测验,您期望二进制以什么“疯狂的答案”?但是显然,很多人故意(?)给出错误的答案,或者实际上在展位时做出不同的决定,或者然后不参加选举,……
Anony-Mousse

3
@ Anony-Mousse不管准确与否,我都看不出少年名字的调用与统计分析之间的关系。
贾里德·史密斯

哦,这是一个无价的故事。在某些日子里,您必须大笑,而不用担心为什么预测结果不准确。
Anony-Mousse's

评论不作进一步讨论;此对话已转移至聊天
gung

7

对数据分析的依赖对战略战役决策,新闻报道以及最终个人选择产生了巨大影响。如果每天只有次关于秘密Ada算法的模拟活动仅能为克林顿竞选活动的决策提供依据,那么可能会出什么问题?400,000

最后,它暴露了数值分析的巨大失败,以弥补对主题知识的缺乏。人们出于明显的理由而羞于明确地拥抱获胜的候选人。

如果有人不愿面对面进行初步民意测验,敲门,那么最糟糕的计算机模型可能会更接近结果。这是一个例子:大选前一天,特拉法加集团(除了以下组织外没有任何隶属关系或知识),特朗普在选举前一天领导了PA,FL,MI,GA,UT和NV(后者的状态最终变成了蓝色)。魔术是什么?

由标准受访者和标准受访者进行的选票测试,表明受访者的邻居所处的位置。这解决了传统民意测验的潜在偏见,在传统民意测验中,受访者对于他们在备受争议的候选人中的立场并不完全真实。

包括缺乏拼写检查在内的相当低端的技术,在很多方面都表现出人性。这是PA中差异

在此处输入图片说明

宾夕法尼亚州历史悠久-距离2016年11月9日凌晨1:40闭幕实现前几个小时,到目前为止还没有被视为民主党失败的最后一根稻草:

在此处输入图片说明


2
询问邻居的投票意图真是太好了-在我看来,这有时是统计学中惯用的巧妙手段之一,它可以(至少在一定程度上)纠正看似毫无希望的偏见。感谢您撰写有关此内容的文章,非常有趣!
DeltaIV '16

5

除了某些人出于某种原因而没有说出真相的原因之外,美国大选中民意测验不准确的原因之一是,“赢家通吃”效应使预测变得更加容易。一个状态的1%差异可能会导致一个状态完全转移,并严重影响整个结果。希拉里拥有更多选民,就像戈尔与布什一样。

英国脱欧公投不是正常的选举,因此也很难预测(没有良好的历史数据,每个人都在这件事上像第一次选民一样)。几十年来投票支持同一党的人稳定了预测。


2
很好的观察。每一侧都有明确的状态,摆动状态也有。虽然他们的票数很低,但对票数很小的影响很大。在美国,这是一个令人费解的,历史悠久的投票计划。
Trilarion '16

4

(只需回答这一点,其他答案似乎涵盖了所有其他内容。)

直到太平洋标准时间(PST)昨天下午4点,博彩市场仍对希拉里4比1有利。我认为博彩市场上有真钱,应该充当所有可用预测模型的集合。

不...但是间接是。

博彩市场经过精心设计,无论发生什么,博彩公司都能获利。例如,目前引述的希拉里赔率是1-4,而特朗普是3-1。如果接下来的十个人都在Hilary上下注10 美元,那么如果Hilary获胜,那100 美元将花费25 美元。因此他们将希拉里缩短到1-5,并将特朗普提高到4-1。现在,越来越多的人押注特朗普,平衡得以恢复。即,它完全基于人们的投注方式,而不是专家或预测模型。

但是,当然,博彩公司的顾客正在看那些民意调查,并听那些专家的话。他们听说希拉里(Hilary)领先3%,赢了一个死票,并决定赚10 美元的快速方法就是在她身上下注40 美元

专家和民意调查间接地改变了可能性。

(有些人还注意到工作中的所有朋友都将投票给特朗普,因此请打赌他;另一些人注意到其Facebook朋友的所有帖子都支持希拉里,因此请打赌她,所以有一些现实影响他们,以这种方式。)


2

当您考虑模型可以访问哪些信息以及哪些信息驱动投票站的行为之间的差异时,这些努力就失败了也就不足为奇了。我正在猜测,但是模型可能考虑到了:

  • 选举前的各种投票结果
  • 历史状态倾斜(蓝色/红色)
  • 具有当前状态倾向/预测的先前选举的历史结果

但是,选举前的民意测验是不可靠的(我们过去曾看到过不断的失败),各州可能会发生变化,而且我们的历史上没有足够的选举周期来解释可能并且确实会发生的多种情况。

另一个复杂因素是民众投票与选举学院的融合。正如我们在这次选举中所看到的,一个州内的民众投票可能非常接近,但是一旦赢得该州,所有选票都将投给一个候选人,这就是为什么地图上有这么多红色的原因。


1

投票模型没有考虑到实际投票时有多少自由主义者可能会从约翰逊换成特朗普。根据Johnson所获得的选票百分比,以微弱优势获胜的州将获胜。巴勒斯坦权力机构(在选举之夜将特朗普推到270位以上)仅给约翰逊2%。新罕布什尔州(去克林顿)给约翰逊4%+。约翰逊在大选前一天的投票率为4%-5%,而在大选当天他的投票率约为3%。

那么,为什么自由主义者突然间在大选之日开始工作呢?没有人考虑过自由主义者选民的核心问题。他们倾向于将宪法的字面解释视为经典。大多数投票支持克林顿的人并不认为她对法律的轻视是没有考虑的高度优先事项。当然,这并不比他们不喜欢特朗普的一切都高。

不管她的法律麻烦对其他人是否重要,对于利比里亚人来说,这些麻烦都是重要的。他们会优先考虑将法律合规性视为可选项,最好是让其离开办公室。因此,对于许多人来说,让克林顿卸任将比声明自由主义哲学是一种可行的政治哲学更为重要。

他们中的许多人甚至可能都不喜欢特朗普,但如果他们认为他会比克林顿更尊重法治,那么实用主义将为许多人赢得原则,并导致他们在投票时改变投票权。是时候实际投票了。


NH让所有来自自由州项目的人都住在这里。繁荣的自由党和积极的支持者。
约翰

@约翰,新罕布什尔州自由主义者坚持约翰逊(4%)。特朗普失去了1%的州。
德米特里·鲁巴诺维奇

我明白那个。我试图解释的是,自由党在新罕布什尔州很强大。
约翰

@John,但不只是NH。明尼苏达州:约翰逊4%,特朗普输了2%;内华达州(NV)(很难说,但趋势仍然存在):约翰逊3.5%,特朗普输了2%;缅因州:约翰逊5%,特朗普输了3%;科罗拉多约翰逊5%,特朗普输了3%。
德米特里·鲁巴诺维奇

Afaik,民意调查询问可能进行的投票切换,并且预测已将其考虑在内。您是否有任何信息表明选举之前存在任何预测未考虑到的信息,或者这纯粹是猜测?

1

民意调查不是历史趋势。贝叶斯会询问历史趋势。自亚伯拉罕·林肯(Abraham Lincoln)以来,已有一个共和党和一个民主党担任总统职位。从那时起,维基百科的派对变化趋势有16次,具有以下累积质量函数

在此处输入图片说明

x

让记者,民主党和民意测验者认为有利于自由主义者获胜的可能性也许是一厢情愿。行为可能在一定范围内是可以预测的,但在这种情况下,民主党人希望人们不要投票赞成改变,而且从历史的角度来看,似乎很有可能会出现改变。


0

我认为民意调查的结果是根据公众范围推算出来的,前提是假设选民的人口统计数据与民意调查的人口统计数据相似,并且可以很好地代表整个人口。例如,如果10个少数民族中有7个在投票中支持希拉里,并且该少数民族代表美国人口的30%,那么大多数民意测验假设30%的选民将由该少数民族代表,并转化为21%的选民收益希拉里。实际上,白人,中上阶层男性在选民中的代表更好。不到50%的合格人士投票,但这并不能表示所有性别,种族等的50%的折扣。

或者,民意调查假设完全随机化,并以此为基础建立模型,但实际上,选民数据偏向年龄较大的中上层男性。

或者,民意调查并未完全假设完全随机化,但其推断参数低估了选民人口统计的异质性。

预计到达时间:前两次选举的民意调查表现较好,这是因为人们通常不太看好团体对投票的关注。


据我所知,所有民意测验的预测都基于“可能的选民”。我无法想象民意测验假设20岁的人与70岁的人有相同的投票机会。似乎更核心的问题是:某人投票的可能性有多大?
dimpol '16

人口统计是最简单的部分。您只需将样本人口加权为实际人口即可。但是,要考虑选民投票率和其他答案中提到的偏见要困难得多。
Graipher

投票者解决这些问题的方式有很多。有些人在人口结构上进行了重新平衡或根据政党的隶属关系进行了重新平衡,另一些则没有。但是,由于使用民意调查平均值的模型存在差异,因此最终结果应针对其他民意调查无法共享的一种方法所特有的问题,尤其是在控制了特定党派的历史偏见(即房屋效应)之后轮询操作。平均轮询结果中的问题必须来自共享方法或效果,而不是每个轮询特有的方法。
ohwilleke '16

0

HoraceT和CliffAB(很抱歉,发表评论的时间太长了)恐怕我有一辈子的例子,这些例子也告诉我,如果我想避免冒犯他人,我需要非常小心他们的解释。因此,尽管我不想让你放纵,但我还是请你耐心等待。开始:

首先举一个极端的例子,我曾经看到一个建议的调查问题,该问题询问文盲的乡村农民(东南亚),以估计他们的“经济回报率”。暂时不考虑响应选项,我们可以希望所有人都认为这是一件愚蠢的事情,但是始终如一地解释为什么它如此愚蠢并非易事。是的,我们可以简单地说这是愚蠢的,因为受访者不会理解该问题,而只是将其视为语义问题。但这在研究环境中确实不够好。曾经有人提出过这个问题,这表明研究人员对于他们认为的“愚蠢”具有内在的可变性。为了更客观地解决这个问题,我们必须退后一步,透明地声明一个有关此类事情决策的相关框架。有很多这样的选择,

因此,我们透明地假设我们有两种基本信息类型可用于分析:定性和定量。并且两者通过一个转换过程相互关联,因此所有定量信息最初都是定性信息,但经过以下(过于简化)的步骤:

  1. 约定设置(例如,我们所有人都决定[不管我们如何看待它,我们都将白天的天空称为“蓝色”。)
  2. 分类(例如,我们根据此约定评估房间中的所有物品,并将所有物品分为“蓝色”或“非蓝色”类别)
  3. 计数(我们计算/检测房间中蓝色物体的“数量”)

请注意(在此模型下)没有步骤1,就没有质量这样的东西,如果您不从步骤1开始,就永远不会产生有意义的数量。

一经陈述,所有这些看起来都很明显,但是(我发现)正是这样的第一组原则被最普遍地忽略了,因此导致了“垃圾入场”。

因此,以上示例中的“愚蠢”变得非常明确,因为未能在研究人员和受访者之间建立共同的约定。当然,这是一个极端的例子,但更细微的错误同样会导致垃圾产生。我看到的另一个例子是对索马里农村地区的农民进行的一项调查,询问“气候变化如何影响您的生计?”暂时暂时不考虑应对方案,我建议即使是向索马里中西部的农民询问美国将严重无法使用研究者与受访者之间的共同公约(即所谓的“气候变化”)。

现在让我们继续到响应选项。通过允许受访者对一系列选择选项或类似结构的答案进行自我编码,您也将这个“约定”问题推到了质疑的这一方面。如果我们都在响应类别中坚持有效的“通用”惯例(例如,问题:您住在哪个城镇?响应类别:研究区域中所有城镇的列表[加上“不在此区域”]),这可能很好。但是,实际上,许多研究人员似乎为自己的问题和回答类别的微妙变化感到自豪,以满足他们的需求。在同一调查中,出现了“经济回报率”问题,研究人员还要求受访者(贫困村民)提供他们对哪个经济部门有所贡献:答复类别为“生产”,“服务”,“ “制造”和“营销”。显然,定性惯例问题再次出现在这里。但是,由于他使回答相互排斥,因此被调查者只能选择一种选择(因为“这样更容易注入SPSS”),而村民则例行生产农作物,出售劳动力,制造手工艺品并将一切都带走。本地市场本身,这位特殊的研究人员不仅与受访者有约定俗成的问题,还与现实有关。

这就是为什么像我这样的老乏味的人总是会推荐将编码应用于数据收集后的工作量更大的方法-至少您可以对研究人员持有的惯例进行足够的编码培训(并注意在“调查说明”是一个杯子游戏-现在就让我相信这个杯子吧。还要注意,如果您接受上述“信息模型”(同样,我并不是要声明您必须这样做),这也说明了为什么准常规反应量表的声誉不好。这不仅是史蒂文(Steven)惯例下的基本数学问题(即,即使对于平凡,您也需要定义有意义的原点,您不能对它们进行加法和平均等),而且,它们通常从未经历过任何等同于“量化”的透明声明和逻辑上一致的转换过程(即,上面使用的模型的扩展版本也包含“常规量”的生成[-这并不难去做])。无论如何,如果它不能满足定性或定量信息的要求,那么研究人员实际上声称是在框架之外发现了一种新型信息,因此,责任在于他们充分解释其基本概念基础(即透明地定义一个新框架)。

最后,让我们看一下抽样问题(我认为这与此处已经给出的其他一些答案是一致的)。例如,如果研究人员想应用构成“自由”投票人的惯例,则需要确保他们用来选择抽样制度的人口统计学信息与该惯例一致。这个级别通常最容易识别和处理,因为它在很大程度上由研究人员控制,并且通常是在研究中透明地宣布的假设定性惯例的类型。这也是为什么它是通常讨论或批评的水平,而更根本的问题却没有得到解决的原因。

因此,尽管民意测验人员会提出诸如“您打算在那个时候投票给谁?”之类的问题,但我们可能还可以,但其中许多人希望得到比这更多的“幻想”……

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.