给定一些用于预测的数据集,
例如说我有不同的房价预测数据集:
数据集 1:100 个训练样本和 100 个测试样本,50 个特征
数据集 2:100 个训练样本和 100 个测试样本,120 个特征
数据集 3:1000 个训练样本和 1000 个测试样本,50 个特征
数据集 4:1000 个训练样本和 1000 个测试样本,5000 个特征
对于每个数据集,我应该如何从以下线性回归模型中选择估计未知参数(预测价格)的最佳方法?
普通最小二乘
逐步回归
主成分回归
偏最小二乘回归
我应该对这些中的每一个进行试验并比较结果,还是有任何关于何时根据数据集使用它们的重击规则?
请帮忙