奥巴马竞选中的数据挖掘技术


10

我在奥巴马的竞选活动中碰到了有关数据挖掘团队的文章。不幸的是,本文对统计算法的实际机制非常模糊。但是,听起来好像一般技术在社会和政治科学中都是众所周知的。既然这不是我的专业领域,那么谁能指出我有关此类技术的(概述)文献吗?

Answers:


16

该区域称为微目标定位(如果您想对其进行Google搜索)。竞选活动的工具和程序相当秘密,因此据我所知,除了哈尔·马尔乔(Hal Malchow)的《政治目标》(2008年)或格林和格伯(2008年)的《投票:如何增加选民投票率》(后者处理)外,出版的作品不多还有社会科学方面的内容,例如什么广告有效等等。

在更多技术问题上,文献甚至更少,例如,请参阅Murray&Scime(2010)Imai&Strauss(2011)撰写的《政治分析》论文(后印)或Rusch,Lee, Hornik,Jank&Zeileis(2013)印后)。它们的共同点是它们利用了大多数基于树的数据挖掘技术。

Murray&Scime使用标准分类树,例如CART。

Rusch等。使用分类树,逻辑模型以及树和逻辑回归的混合体。他们还使用随机森林,神经网络,支持向量机和贝叶斯可加回归树等方法来与它们的树混合体进行比较,如本文的后一部分所述。它们的混合树与数据集上的其他方法具有同等的性能,并提供更高的可解释性(我们也共享其代码和数据)。

Imai&Strauss颇为有趣,因为他们提供了用于最佳战役计划的综合决策理论框架,而不仅仅是像其他人那样的用于微观目标的工具。因此,他们非常关注运筹学方面的问题,即如何从竞选活动中获得最大收益。在他们采用统计技术进行微观定位和投票率估计的框架方面,他们再次依赖分类树。

因此,似乎已经达成共识,即基于树的方法的使用在该领域工作良好。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.