数据挖掘 - 对于单变量数据集，什么是好的机器学习模型？ - 吾爱随笔录

这是我的问题场景：-我必须提出一个作为频率函数的功率方程。该图非常适合高阶多项式（第 4 或第 6）：-

P o w e r = θ_{0} + θ_{1} f r^{1} + \dots + θ_{6} * f r^{6}

$Power = \theta_0 + \theta_1 fr^1 + \ldots + \theta_6*fr^6$

（这是来自 MS Excel 散点图的趋势线）频率（x 轴）范围在固定范围内 $f_1$ 到 $f_2$ 我有来自 $100$ 这种频率扫描的不同设备。

有了这个有限的数据集，什么是一个好的 ML 模型来训练和概括适用于任何看不见的设备的系数？

提前致谢！

编辑：-

虽然我不能在这里分享确切的数据集，但让我分享一些关于数据的信息—— $fr$ 范围从 $4060(f_1)$ 到 $4165(f_2)$ ; 我可以选择细化，即步长为 $+1$ ..目前我要去 $+5$

在哪里 $Pij$ 是功率值 $i$ 设备和 $j$ th 频率样本 问题：我是否应该将每个设备视为示例，将每个频率视为一个特征？在那种情况下，问题会变成多变量，我不希望这样。我希望等式保持与上述完全一致。更理想的选择是以每个频率为例，那么我如何对待每个频率 $100$ 设备？绝对不是特征..如何将问题空间建模为特征向量 $X$ 和 ans 矢量 $Y$ 和参数向量 $\theta$ ?