PCA 名称中的“组件”一词应该是单数还是复数?

机器算法验证 主成分分析 术语
2022-03-20 09:10:57

我想知道哪个命名是正确的:主成分分析或主成分分析。

当我搜索“主成分分析”时,我得到了 526,000,000 个相关结果,而当我搜索“主成分分析”时,我得到了 482,000,000 个相关结果所以前者在谷歌上的数量超过了后者,事实上,当我输入“主成分分析”时,谷歌只显示了标题中包含“主成分分析”的网站,包括维基百科

然而,PCA 在 Ian Goodfellow 著名的《深度学习》一书中被写为“主成分分析”,据我所知,“主成分分析”在生物学文献中应用更为广泛。

尽管我总是假设无论人们使用哪种算法都没有差异,但我想弄清楚哪个更优选使用以及为什么。

4个回答

Ian Jolliffe 在其 2002 年第二版主成分分析(纽约:Springer)的 p.viii 上讨论了这一点——正如您立即可以看到的那样,它以一种方式跳跃。他表达了对这种形式的主成分分析的明确偏好,类似于说因子分析聚类分析,并引用了任何方式都更常见的证据。幸运的是,对于这个问题,这个材料可以在我当地的亚马逊网站上看到,也许也可以在你的网站上看到。

我补充说,形式独立成分分析似乎对这种方法具有压倒性优势,尽管这是否是独立证据可能存在疑问。

从标题上看并不明显,但 JE Jackson 的主成分用户指南(纽约:约翰威利,1991 年)有相同的选择。

从我的书架上抓取的多元书籍样本表明单数形式占多数。

我会尊重的一个论点可能是,在大多数情况下,重点是计算几个主成分,但可以为几个因素或几个集群提出类似的观点。我建议,我不记得在印刷品中看到过的变体因素分析聚类分析通常会被审稿人、文案编辑或编辑视为非标准或错别字。

我看不出主成分分析在任何意义上是错误的,无论是统计上的还是语言上的,而且肯定经常看到,但我建议遵循领先的权威并使用主成分分析,除非你有相反的论据或考虑你自己的口味最重要的。

我以英语为母语(英国)的人写作,不知道在任何其他语言中是否存在相反的论点——也许是通过语法规则,因为 PCA 的数学和统计是通用的。我希望在这个方向上发表评论。

如果有疑问,请定义一次 PCA,然后再参考它,并希望任何对您不使用的表格充满热情的人都不会注意到。或者写经验正交函数。

来自 Google Books 的 NGrams表明,从 1960 年到大约 1982 年,它们的使用频率相似,此后无 s形式开始更流行。

这向我表明,这两种形式都没有错,但没有-s 的形式可能会更舒服一些。 在此处输入图像描述

  • 当霍特林第一次将“分析”、“组件”和“主体”这三个词一起使用时。它是复数形式。

    但它还没有完全和 PCA 一样,它是“主成分方法”或标题“将统计变量的复合体分析成主成分”。

  • 在大多数其他语言中,使用复数形式。例如,在法语中是“Analyse en composantes principales”,在德语中是“Hauptkomponentenanalysis”。

然而,在英语中,单数形式更为常见。

单数形式的原因是因为这是英语中的常用方式。请参阅英语论坛上的规范问题:

定语名词什么时候是复数?.

还有许多其他相关问题,例如“数字分析”。

我将其学习为“主成分分析”,我发现其他一些人坚持认为单数更好。

你在“书店”买书,而不是在“书店”买书,你不会碰十英尺长的东西,不是十英尺长的杆子等等。这是英语的一个特点。在德语中恰恰相反:复数用于这样的事情。所以“主成分分析”遵循英语中通常遵循的模式。