在我目前的项目中,我正在对红外光谱 (FTIR) 使用 PLS 回归。为此,我使用 R 和plsr包中的 pls 函数。pls总是意味着输入数据和红外光谱的中心。使用拟合 PLS 模型进行预测时,将从数据中减去在估计过程中拟合的均值。
在一种特殊情况下,这对我来说不是一个理想的效果,因为每个 IR 波数的平均值在测量之间不是恒定的。这是因为穿过样品的光束的路径长度可能会发生变化,或者是因为特定机器的路径长度与用于拟合模型的机器不同,或者是因为路径长度会随着时间缓慢变化,因为测量单元的磨损。
通过不意味着使数据居中,该均值最终成为第一个 PLS 因子。这允许对平均值进行线性缩放,同时考虑到诸如细胞路径长度之类的线性效应。这使得模型在特定情况下更加健壮。我知道我们可以先校正红外光谱,然后使用拟合方法。但是,我们想把它放在拟合模型中。
我向 PLSR 包的维护者发送了一封电子邮件,说明为什么该包不支持关闭均值居中。回复是:
不,那是不可能的。从理论上讲,如果一个人不居中,则不是 PLSR。
光谱学领域中使用的其他工具(Grams、Unscrambler)确实允许关闭平均定心。在上述情况下,我觉得禁用均值居中有很大的优势。
现在我的具体问题:
没有均值居中的 PLS 仍然是 PLS,是否有任何理论或实践理由不这样做?
