我正在使用支持向量回归来模拟一些相当倾斜的数据(具有高峰度)。我已经尝试直接对数据进行建模,但我得到了错误的预测,我认为这主要是由于数据的分布,它与非常肥大的尾巴正好倾斜。我很确定一些异常值(它们是合法的数据点)正在影响 SVR 训练,也许还会影响交叉验证,目前我正在通过最小化均方误差来优化超参数。
我尝试在应用 SVR 之前缩放我的数据(例如使用 sqrt 函数来减少异常值)以及使用不同的超参数最小化函数(例如绝对误差),这似乎可以提供更好的结果,但仍然不是很好。我很好奇是否有人遇到过类似的问题以及他们是如何解决的?欢迎任何建议和/或替代方法。