为回归问题重新采样正态分布数据集?

数据挖掘 回归 采样
2022-03-02 08:26:58

我有一个来自操作过程的数据集,有 5 个测量值和 1 个结果。所有值均呈正态分布。当我在数据集上训练回归模型时,它在大部分数据集上表现良好 - 过程的默认操作条件。尽管在默认操作条件之外,它的表现要差得多,值远离平均值。如果这是一个分类问题,我会将其视为类不平衡并执行一些重采样技术来获得平衡的类。对于回归问题,我该如何处理?

1个回答

一种选择是贝叶斯回归。贝叶斯回归不是为每个回归系数估计一个点估计,而是估计一个后验分布。后验分布将更好地模拟整个经验值范围。