预处理与正则化

计算科学 线性求解器 预处理 回归 线性系统
2021-11-29 09:42:56

我曾经更多地是一个数值线性代数和计算科学的人,但最近,我涉足了统计和机器学习。

在本次讨论中,让我们关注理论上不是单数的矩阵,而是“数值单数”的矩阵,这是我通常用来描述高条件数系统的矩阵。

在数值方法中,当您有一个病态线性系统时Ax=b,您可以对线性系统应用一个预处理器,它(希望)使问题适定,从而得到(1)收敛速度更快(2)收敛更准确的解决方案。

病态的统计模拟似乎是“多重共线性”(例如,在线性回归中,您还解决了以下形式的线性系统Ax=b)。它们或多或少都意味着线性矩阵A近似不是满秩或近似奇异的,这意味着您获得的解决方案可能不是唯一的,或者对于输入中的轻微扰动表现出高度的方差。在统计学中,首选方法似乎是2要么1正则化,他们称之为“岭”和“套索”回归。

我想知道为什么预处理不是统计界的首选方法,为什么正则化不是数值方法/科学计算界的首选方法?

我对后者的怀疑是正则化为您提供了一个独特的解决方案,但是您正在解决一个完全不同的系统,该系统可能无法代表您最初尝试解决的问题,因此在某些情况下,这似乎是不可接受的'正在使用描述基础物理/化学/等的基础数学模型对物理系统进行建模......

1个回答

我认为这里有一些行话混乱。所以我会强调一些单词和我使用它们的上下文。

在 NLA 中,当我尝试解决问题时(它们通常来自 PDE 的离散化),我知道问题是适定的,即事先有一个唯一的解决方案。该问题可能是病态的(与条件良好的相反),并且可以通过对矩阵进行预处理来缓解。但是如果矩阵是奇异的,那么预处理它不会有太大帮助,如果有的话。有例外;例如,静水压力(相应矩阵的秩比完整矩阵少 1),您可以通过强制均值为零来保证解的唯一性。但即使在那种情况下,预处理也不是用来修复问题的奇异性,而是用来加速求解。

另一方面,正则化用于使问题适定(与病态相反)并强制解决方案是唯一的。但是,正如您所提到的,在这种情况下,正则化问题的解决方案可能不是原始问题的解决方案。如果您不期望一个独特的解决方案开始,这没什么大不了的。

另外我应该补充一点,拉格朗日乘数方法(通常用于优化和统计)可以被认为是预处理的一种形式。但它从不被视为正则化(即使它具有相似的形式)。所以,IMO,说预处理不是统计界的首选方法是错误的。除了一小部分问题之外,它并不是很有用。