假设我们有两个点(下图:黑色圆圈),我们想为它们之间的第三个点(十字)找到一个值。事实上,我们将根据我们的实验结果,即黑点来估计它。最简单的情况是画一条线,然后求值(即线性插值)。如果我们有支持点,例如,作为两边的棕色点,我们更愿意从它们中受益并拟合非线性曲线(绿色曲线)。
问题是,将红十字标记为解决方案的统计推理是什么?为什么其他十字架(例如黄色的十字架)不是它们可能的答案?什么样的推论或(?)促使我们接受红色的?
我将根据这个非常简单的问题得到的答案来开发我的原始问题。
假设我们有两个点(下图:黑色圆圈),我们想为它们之间的第三个点(十字)找到一个值。事实上,我们将根据我们的实验结果,即黑点来估计它。最简单的情况是画一条线,然后求值(即线性插值)。如果我们有支持点,例如,作为两边的棕色点,我们更愿意从它们中受益并拟合非线性曲线(绿色曲线)。
问题是,将红十字标记为解决方案的统计推理是什么?为什么其他十字架(例如黄色的十字架)不是它们可能的答案?什么样的推论或(?)促使我们接受红色的?
我将根据这个非常简单的问题得到的答案来开发我的原始问题。
任何形式的函数拟合,即使是非参数拟合(通常对所涉及的曲线的平滑度做出假设),都涉及假设,因此是一种信念的飞跃。
线性插值的古老解决方案是当您拥有的数据“足够”细粒度时“才有效”(如果您看一个足够近的圆,它看起来也很平坦 - 问问哥伦布),甚至是可行的在计算机时代之前(许多现代样条解决方案并非如此)。假设函数将在两点之间“继续在相同(即线性)物质中”这一信念是有道理的,但没有先验原因(除非对手头的概念有了解)。
当您有三个(或更多)非共线点(例如添加上面的棕色点时)时,很快就会清楚,每个点之间的线性插值很快就会涉及每个点中的尖角,这通常是不需要的。这就是其他选项跳入的地方。
但是,如果没有进一步的领域知识,就无法肯定地说明一种解决方案比另一种更好(为此,您必须知道其他点的值是什么,从而违背了将函数拟合到第一名)。
从好的方面来说,也许与您的问题更相关,在“规律性条件”下(阅读:假设:如果我们知道该函数是平滑的),线性插值和其他流行的解决方案都可以被证明是“合理的”近似值。仍然:它需要假设,对于这些,我们通常没有统计数据。
您可以计算出最佳拟合线的线性方程(例如 y = 0.4554x + 0.7525 ),但这仅在有标记轴的情况下才有效。然而,这不会给你确切的答案,只有与其他点最合适的答案。