随机森林回归分析 - 理解问题

数据挖掘 随机森林
2022-03-02 10:25:59

我对随机森林回归有一个深刻的理解问题。Target 是一个大学项目:我们必须用 R 中的财务数据进行随机森林回归分析。我已经阅读了很多小时的随机森林示例,其中大部分是分类类型,例如预测股票价值的上涨或下跌。在回归的情况下,我站在线上..我的想法如下:

如果我有一个类似以下结构的数据集:

Date | Open | High | Low | Close | Volume

...我可以添加一些技术工具,如 RSI、SMA 等

然后我将数据集拆分为训练和测试数据,执行随机森林程序并通过预测测试数据来关闭它。但这真的是随机森林回归分析的目的吗?我猜一个“正确”的回归分析是比较两只股票,看看它们是否相关,以根据另一只股票预测一只股票的价值——但另一方面,这是一个经典的回归分析——在没有随机森林算法的情况下. 我在理解目的方面遇到了很大的问题......

1个回答

在实际回归过程的情况下,您可以进行训练/测试拆分或 K-fold 或任何其他交叉验证方法来评估模型的性能。如果您对性能感到满意,则可以使用所有数据进行训练。要预测未来,您可以在 sklearn 中使用 predict(X) 函数。