给定泰勒级数和足够的数据以避免过度拟合的风险,您是否真的需要考虑您的现象是否遵循指数、二次、对数等行为?我相信您可以提出反例来说明这不是一个好主意,但是如果我们非常笼统和务实,那么将数据拟合到某种程度的九多项式通常是否“很好”希望无论如何奇怪的模式隐藏在数据中会很好地近似于它的幂级数吗?
给定大量数据,我们总是可以用多项式对其进行建模吗?
机器算法验证
曲线拟合
泰勒系列
2022-03-15 17:00:04
1个回答
想象一下,用多项式参数替换任意模型,并为解释变量的所有值及其所有交互设置一系列虚拟变量。如果你有足够的实验数据,那将是尽可能普遍的。所有交互的最高阶多项式函数也将拟合数据。因此,如果您有数据和设置来估计完全饱和的模型,那将是无模型的。
例如,考虑真正的模型是 X 和 Y 只取虚拟值的地方:
Z = F(X,Y)
你也可以把这个模型写成:
Z = beta0 + beta1 * 1(X) + beta2 * 1(Y) + beta3 * 1(X) * 1(Y)
这些函数在 X 和 Y 的取值上到处匹配。如果你有多个参数并且它们取多个值,这会变得非常棘手,但原理是一样的。
我从Mostly Harmless Econometrics (p. 48 - 51) 中了解到这一点,他们认为饱和建模的情况意味着线性建模与非线性建模同样普遍。转向非饱和模型意味着非线性模型可以覆盖具有较少参数的函数,但具有足够的自由参数和估计它们的数据,它们覆盖了同一组模型。
其它你可能感兴趣的问题