我想知道对于存在因变量的数据集是否有类似于 PCA 的东西。(虽然我对任何降维方法都感兴趣,但 PCA 只是一个例子。)PCA 将采用 64 维数据集(例如),并可能返回 4 维来解释 95% 的方差。在此示例中,您可以从新空间中的 4 点向量和协方差矩阵中恢复具有相当高保真度的原始记录。
那么,如果 x 有 64 个维度,并且数据的形式为 (x, y),其中 y 是一个度量值,那又如何呢?有没有类似的东西,可以让我从一组较低维度的输入中预测 y?即y g(x'),其中dim(x') < dim(x),并且有一个映射m:x' x。(y' = g(x') 和另一个地图 p: y' y 也可以。)
通常人们在这种情况下所做的是选择一个模型,如 GLM 并进行部分回归,消除回归系数接近 0 的那些维度。但是我正在寻找一种不假设任何类型的模型的方法全部。这些存在吗?
下图说明了这种极端情况。名义上数据是二维的,但 y 维只是一点点 0 均值噪声——仅根据 x 就可以很好地估计 z。所以我想知道是否有一种技术可以得出这一点,这里还有冗余不太明显的情况。