系数的大小可能只会增加到一定程度的多项式。这是由于您正在使用小号n ( 2 π _x ), 如果你使用S我n ( 4 πx )那么系数的大小将增加到更多的多项式次数。当s我n ( x )表示为系列:
s我n ( x ) =X1 !-X33 !+X55 !. . . .
在你的情况下x → 2 πX所以为了近似它,高阶项必须具有非常高的系数,分母阶乘项不能抵消(尽管只能达到某个点),因此对于像这样的小订单ñ= 10(假设我们在系列中有偶数项,因为我们不处理数学确定性,所以偶数项会以某种方式抵消或被抵消),10 != 3628800然而( 2 π)10= 95410558大约 26 倍。所以你看到直到某一点,系数值必须增加小号n ( 2 π _x ). 我认为这回答了你的两个问题。
谈到你的第二个问题,一般来说,我们可以松散地说,你使用的 ML 算法执行多项式回归,这意味着通过调整参数来拟合曲线,使得模型生成的点之间的距离对于给定的输入, 尽可能接近真实数据。
所以问题是为什么增加数据点可以提供更好的泛化?大多数人没有提到的是,现在你对函数本身有了更好的概括,我的意思是,如果我给你 2 分(根据奈奎斯特采样定理,定义一个sin一定频率的波)从sin曲线,除非您事先知道,否则您无法判断它是否是从sin,但如果我在同一时间段内(正弦波)给你 100 分,你可以很容易地猜出数据必须是从sin. 同样,当数据点的数量较少时,ML 算法无法猜测数据是从哪里生成的,并尝试根据其最佳猜测(最小损失)来拟合模型,但如果你给出更多的点,它会做出更好的猜测,从而更好地概括。
像这样想,你想用橡皮筋绕着别针做一个圆圈。你能用4-5个针做吗?您至少需要一定数量的针脚才能使它看起来像一个圆圈。这里的橡皮筋是你的模型。