PLS(偏最小二乘)权重、载荷和分数解释

机器算法验证 scikit-学习 偏最小二乘法
2022-04-01 03:55:07

在 SKLearn PLSRegression 中,可以在训练模型后调用几个项目:

  • 装载量
  • 分数
  • 重量
  • 以上都用X和Y隔开

我直观地理解 x_scores 和 y_scores 应该具有线性关系,因为这就是算法试图最大化的。

然而,尽管阅读了多种资源,我发现有些文章可以互换使用术语载荷和权重,但我知道它们是不同的。我认为载荷是描述每个组件“指向”位置的“方向”向量值。但是重量呢?

TL;DR: SKLearn PLSRegression 中的权重和载荷有什么区别?

1个回答

更新:

对于我正在从事的项目,请多阅读一些内容,我有一些链接可以分享,可能会有所帮助。PLS 模型中的“权重”用于将 E_a(缩小的X 矩阵)转换为分数矩阵 t_a 中的列。通货紧缩发生在算法的每一步之后,减去新组件所解释的方差。另一方面,载荷将 T 转换为 X。

这是一个很棒的参考,并且更详细: https ://learnche.org/pid/latent-variable-modelling/projection-to-latent-structures/how-the-pls-model-is-calculated

我还通读了plsr几次小插图。它是 R,但概念应该翻译:https ://cran.r-project.org/web/packages/pls/vignettes/pls-manual.pdf

原始答案:

http://www.eigenvector.com/Docs/Wise_pls_properties.pdf

根据该资源,权重需要“保持正交分数”。从幻灯片 35 开始有一些不错的可视化效果。