奥巴马竞选中的数据挖掘技术

机器算法验证 数据挖掘 社交网络 社会科学
2022-03-14 10:26:41

我看到了这篇关于奥巴马连任竞选中数据挖掘团队的文章。不幸的是,这篇文章对统计算法的实际机制非常模糊。然而,这听起来好像一般技术在社会和政治科学中是众所周知的。由于这不是我的专业领域,任何人都可以向我指出有关此类技术的(概述)文献吗?

1个回答

该区域称为微定位(如果您想用谷歌搜索)。竞选活动对他们的工具和程序非常保密,所以据我所知,除了 Hal Malchow 的《政治目标》(2008 年)或 Green & Gerber 的(2008 年)《退出投票:如何提高选民投票率》(后者涉及更多地涉及社会科学方面,例如哪些广告有效等)。

在更多技术问题上,文献更加稀缺,但请参见Murray & Scime (2010) 、 Imai & Strauss (2011)的政治分析论文后印)或我们最近的应用统计年鉴论文Rusch, Lee, Hornik、Jank & Zeileis (2013)后印本)。它们的共同点是它们都使用数据挖掘技术,主要是基于树的。

Murray & Scime 使用标准分类树,如 CART。

鲁施等人。使用分类树、逻辑模型以及混合树和逻辑回归。他们还使用(除其他外)随机森林、神经网络、支持向量机和贝叶斯加法回归树来与他们的混合树进行比较,如论文的回复中所述他们的混合树在其数据集上的表现与其他方法相当,并提供更高的可解释性(我们还共享他们的代码和数据)。

Imai & Strauss 很有趣,因为他们提出了一个全面的决策理论框架来优化活动计划,而不仅仅是像其他人那样的微目标工具。因此,他们非常关注运营研究的各个方面,即如何充分利用投入到竞选活动中的每一美元。在他们使用统计技术进行微定位和投票率估计的框架方面,他们再次依赖分类树。

因此,似乎存在一些共识,即基于树的方法在该领域的使用效果很好。