请注意,我正在交叉发布此答案,因为该问题是交叉发布的,其中一个问题可能会被删除。如果这违反了礼节,请告诉我。交叉帖子在这里。
这个问题有两个部分,至少是隐含的。第二部分,一般来说,是如何从神经网络中训练和预测(在 Python 中)。第一部分是(隐含地)我们如何建立一个模型,根据人口统计数据(正确地)预测哪个人赢得了总统职位。
第二个问题的答案说起来很容易,但做起来却很难。它归结为一个相当无益的陈述: 了解神经网络,并使用这些知识。谷歌关于神经网络的教程。我会提出建议,但我不了解您的数学、统计和计算机科学背景,因此无法真正提出建议。
然而,我可以回答第一个问题,尽管可能不是您想要的方式。仅使用您列出的数据,您就不太可能从您的神经网络或您适合的任何其他模型中获得任何类型的准确性。为什么?有几个原因。
首先是,除非您总是可以将总统分为两个(或更多)不同的群体之一,就像在美国(民主党、共和党)那样,您的数据一直在变化。如果没有类,您就无法对任何内容进行分类,这在某些国家/地区很困难。
其次,即使有不同的类别,人口统计数据也可能不是一组好的预测指标。人口数据的变化取决于地方治理的好坏以及整体治理。您也许可以以某种方式对其进行编码。但人口统计数据也会因许多其他因素而发生变化。当谈到投票时,人们会根据一堆事情选择投票,而他们的人口统计状况只是一个因素。
第三个原因更多的是谨慎。神经网络和各种机器学习/统计建模方法可以使用正确的数据提供良好的预测。预测总统之类的事情相对困难,尤其是在较小的国家。(Nate Silver 在美国做得很好,但那里的数据要多得多。)即使你有很好的数据和很好的模型,你也总会错过一些东西。George Box 说得对:“所有模型都是错误的,但有些模型是有用的。” 当你提到正确预测时,我脑海中就会响起各种各样的警钟。尝试“正确”预测的问题在于,即使在简单的情况下,也不能保证您的预测是正确的。没有模型是完美的。