功能数据分析和高维数据分析有什么区别

机器算法验证 数据挖掘 曲线拟合 信号处理 功能数据分析 小波
2022-03-26 12:20:52

统计文献中有很多关于“功能数据”(即曲线数据)的引用,同时也提到“高维数据”(即当数据是高维向量时)。我的问题是关于这两种数据之间的区别。

当谈到适用于案例 1 的应用统计方法时,可以理解为从案例 2 中通过投影到函数空间的有限维子空间的方法的重新表述,它可以是多项式、样条、小波、傅里叶...... . 并将函数问题转化为有限维矢量问题(因为在应用数学中,一切都在某个时刻变得有限)。

我的问题是: 我们是否可以说任何适用于功能数据的统计程序也可以(几乎直接)应用于高维数据,并且任何专用于高维数据的程序都可以(几乎直接)应用于功能数据?

如果答案是否定的,你能举例说明吗?

在 Simon Byrne 的回答的帮助下编辑/更新:

  • 稀疏性(S-稀疏假设,lp球和弱lp球为p<1) 在高维统计分析中用作结构假设。
  • “平滑度”被用作功能数据分析中的结构假设。

另一方面,傅里叶逆变换和小波逆变换都是将稀疏性转化为光滑度,而光滑度通过小波和傅里叶变换转化为稀疏度。这使得西蒙提到的关键差异不那么关键?

2个回答

是和不是。在理论层面,这两种情况都可以使用相似的技术和框架(一个很好的例子是高斯过程回归)。

关键的区别是用于防止过度拟合(正则化)的假设:

  • 在函数的情况下,通常有一些平滑假设,换句话说,彼此接近的值应该以某种系统的方式相似。这导致使用诸如样条、黄土、高斯过程等技术。

  • 在高维情况下,通常有一个稀疏性假设:即只有一个维度的子集会有任何信号。这导致了旨在识别这些维度的技术(Lasso、LARS、slab-and-spike 先验等)

更新:

我并没有真正考虑过小波/傅里叶方法,但是是的,用于此类方法的阈值技术旨在投影空间中的稀疏性。相反,一些高维技术假设投影到低维流形上(例如主成分分析),这是一种平滑假设。

功能数据通常涉及不同的问题。我一直在阅读函数数据分析,Ramsey 和 Silverman,他们花了很多时间讨论曲线配准、翘曲函数和估计曲线的导数。这些问题往往与对研究高维数据感兴趣的人提出的问题截然不同。