对于单变量数据集,什么是好的机器学习模型?

数据挖掘 回归 线性回归
2022-03-13 02:28:21

这是我的问题场景:-我必须提出一个作为频率函数的功率方程。该图非常适合高阶多项式(第 4 或第 6):-

Power=θ0+θ1fr1++θ6fr6

(这是来自 MS Excel 散点图的趋势线)频率(x 轴)范围在固定范围内f1f2我有来自100这种频率扫描的不同设备。

有了这个有限的数据集,什么是一个好的 ML 模型来训练和概括适用于任何看不见的设备的系数?

提前致谢!

编辑:-

虽然我不能在这里分享确切的数据集,但让我分享一些关于数据的信息——fr范围从4060(f1)4165(f2); 我可以选择细化,即步长为+1..目前我要去+5

可视化数据框

在哪里Pij是功率值i设备和jth 频率样本 问题:我是否应该将每个设备视为示例,将每个频率视为一个特征?在那种情况下,问题会变成多变量,我不希望这样。我希望等式保持与上述完全一致。更理想的选择是以每个频率为例,那么我如何对待每个频率100设备?绝对不是特征..如何将问题空间建模为特征向量X和 ans 矢量Y和参数向量θ?

1个回答

你的问题不是很具体。我假设您正在寻找完整的解决方案(语言、包、功能、模板)。因此,考虑到这一点,我将向您指出以下问题: Polynomial regression using scikit-learn

答案的一半是萨尔瓦多·达利(Salvador Dali )的解决方案:

Language: Python
Package:scikit-learn
Function: linear_model.LinearRegression()