如何计算 PLS 中回归系数的置信区间?

机器算法验证 回归 置信区间 潜变量 偏最小二乘法
2022-03-17 15:34:28

PLS的基本模型是给定的矩阵向量通过 其中是潜在的矩阵,并且是噪声项(假设居中)。n×mXny

X=TP+E,
y=Tq+f,
Tn×kE,fX,y

PLS 产生的估计值和回归系数的“捷径”向量使得我想在一些简化假设下找到的分布,其中可能包括以下内容:T,P,qβ^yXβ^β^

  1. 模型是正确的, 对于未知的X=TP+E,y=Tq+fT,P,q
  2. 潜在因素的数量是已知的,并用于 PLS 算法;k
  3. 实际误差项是具有已知方差的独立同分布零均值正态;

这个问题的定义有些不明确,因为“PLS”算法有很多变体,但我会接受其中任何一个的结果。我也会接受有关如何通过例如分布的指导,但也许这是一个单独的问题。β^

2个回答

您知道这篇文章:PLS 回归:化学计量学的基本工具( PDF )?为 PLS 参数推导 SE 和 CI 在 §3.11 中描述。

我通常依靠 Bootstrap 来计算 CI,如 Abdi, H. Partial minimum squares regression and projection on Latent Structure Regression (PLS Regression)中所建议的那样。另请参阅plspm包及其随附的教材:PLS Path Modeling with R

我似乎记得 Tenenhaus M. (1998) La régression PLS: Théorie et pratique (Technip) 中讨论了一些理论解决方案,但我现在无法检查,因为我没有这本书。目前,有一些有用的 R 包,比如plsRglm

PS我刚刚发现了 Nicole Krämer 的作品,参考了plsdof R 包。

我发现了 Reiss等人的一篇论文。人。, 工业批次末质量预测的偏最小二乘置信区间计算,其中出现以下引用:

PLS 预测应伴随在线置信区间以指示预测的准确性。PLS 预测的置信区间的制定是一个尚未得出“黄金标准”的研究领域。

本文包含对 Faber 和 Bro 的“对此类工作的出色调查”、多路 PLS 预测的标准误差以及Faber 和 Kowalski 的论文、 测量误差的传播以验证通过主成分回归获得的预测进行验证的参考和偏最小二乘我将在这些结果可用时对其进行总结...