与 ANN-BP、随机森林(其他分类器)相比,支持向量分类器在输入特征而不是转换特征方面表现良好

数据挖掘 随机森林 支持向量机 分类器
2022-02-23 18:34:47

我正在处理具有 5 个原始特征 (OHLCV) 的股票数据。使用技术分析师使用的少量转换,已经创建了 20 多个提供不同类型指示的功能。当试图预测未来几天的方向时,SVM 显示的行为与其他分类器相反。(当考虑 5 个原始输入时,SVM 会给出更好的结果,而其他方法(如预期的那样)在使用生成的特征时会给出更好的结果)

我完全理解市场数据是非常随机和嘈杂的。这是为了理解不同 ML 方法的行为而进行的理论练习。

2个回答

感谢您的回答,结果将由相关数据集驱动是完全有道理的!

是否有任何理论表明当特征数量较少时,与其他 ML 算法(如 NN 和 RF)相比,SVM 可以提供更好的结果?我认为这种行为的另一个原因是由于转换过程中的信息丢失。

尽管支持向量机的结果几乎保持不变,但其他算法的改进是显着的(8-10%)。均值转换数据显示了 RF 和 NN 能够识别并进行分类的模式,而它几乎不影响 SVM 输出。

不查看数据就无法评论这个特殊情况。但是,使分类器在特定情况下变得更好或更差的是模型拟合曲线。请检查这个例子。

如果因变量和自变量之间的关系最好用一条线表示,那么具有径向内核的 SVM 模型的性能将比线性内核差。同样基于算法,​​额外的变量可能会导致模型拟合不佳(或产生惊人的结果)

因此,验证的最佳方法之一是绘制点并查看是否可以证明模型结果(至少部分)。