投票模式的相似之处

数据挖掘 聚类 相似 社会网络分析 距离 参考请求
2022-03-04 06:53:05

我对任何有关投票模式的研究材料感兴趣。

我有一个数据集,显示过去几年我的国家的 PM(议会成员)如何投票。每个 PM 有 3 个按钮:是、否、弃权。还有两种特殊情况:PM 可以在投票期间缺席,他/她可以在场但不投票(这是错误的,但他们有时会这样做)。因此,任何特定的投票结果都表示为一个巨大的向量,其值为 yes/no/abstain/present_not_voted/absent。

我想在 PM 的投票模式中找到一些相似之处,并根据这些相似之处将它们分组。有一些有趣的问题,如联盟稳定性和政党忠诚度(理论上)可以用上述数据来回答。不幸的是,我非常缺乏任何参考资料。

在谷歌搜索时,我遇到了一些基于美国参议员投票形成无向图的网站。它看起来很酷,但我没有找到任何关于如何形成这种图表的解释。直观地说,“相似”是一种对称的二元关系,因此无向图表示听起来很自然。但是如何为我的数据定义“相似性”呢?可能有一些标准的方法可以做到这一点。任何帮助将不胜感激。

1个回答

政治家和政党遵循一套原则和特点。他们在对立法和法案进行投票时总是遵循这些事情。您可以使用 T-distributed Stochastic Neighbor Embedding (t-SNE),这是由 Laurens van der Maaten 和 Geoffrey Hinton 开发的用于可视化的机器学习算法。这种方法有助于我们可视化观察结果的聚类和相似性。

志同道合的国会议员和具有相似原则的政党聚集在一起(邻居)。

t-SNE 1算法包括两个主要阶段。首先,t-SNE 在成对的高维对象上构建概率分布,使得相似对象被选中的概率很高,而不同点被选中的概率极小。其次,t-SNE 定义了低维地图中点的相似概率分布,并且它最小化了两个分布之间关于地图中点位置的 Kullback-Leibler 散度。请注意,虽然原始算法使用对象之间的欧几里德距离作为其相似性度量的基础,但应酌情更改。