随机森林和神经网络的不同精度

数据挖掘 神经网络 喀拉斯 scikit-学习 时间序列 随机森林
2022-02-12 23:09:37

我在神经网络模型和随机森林模型中运行了一组时间序列数据。对于神经网络,我将数据归一化,将其分为 20% 的测试、80% 的验证和训练。这里使用了 Keras 库神经网络。准确率是 85%(我每次都得到不同的准确率)。对于随机森林,我没有对数据进行归一化,测试火车的比例是 20% 和 80%。我在这里使用了 scikit learn。我得到了 93% 的准确率。这里也使用了时间序列数据。我不应该获得与神经网络相似的准确性吗?我究竟做错了什么?(我在那里阅读了一些论文,它们具有类似的准确性。这就是我问的原因。随机森林也可以过拟合吗?我的一个过拟合吗?!

2个回答

不同的模型会给出不同的精度。相同的模型也可以为您提供不同的精度。您可以尝试将种子设置为预定义的值,以在相同的模型结果中带来更高的一致性

将您的模型视为将输入特征映射到响应变量的函数。随机森林分类器/回归器始终是分段常数函数。神经网络是连续函数(它们是线性映射和连续激活函数的连续实现)。它们总是不同的,所以你的工作在这里是准确的。

对于一致性问题,请尝试如上所述设置种子。此外,请尝试向您的模型添加交叉验证,以避免随机选择太好/太差。