我在一本书中阅读了以下有关 MDS 的内容:
使用 MDS 需要了解单个特征的单位;也许我们正在使用无法使用欧几里得度量进行比较的特征。例如,一个分类变量,即使编码为整数(0= 圆形,1= 星形,2= 三角形等),也无法使用欧几里得进行比较(圆形更接近星形而不是三角形?)。
我接受上面的说法,但它对MDA的应用提出了几个问题:
- 鉴于许多传统数据集包含分类特征,这是否意味着 MDA 无法适应这些数据集?
- 也许将距离测量类型(例如“欧几里得”)更改为其他类型是一种解决方案,但
Sklearn没有其他内置选项,更不用说 R,其中cmdscale根本没有选项来指定距离类型。一般如何更改此功能?
另一个问题:我读过PCA是一种MDS(反之亦然),除了前者侧重于方差,后者侧重于保持距离。我是否正确地认为这两个以某种方式“收敛”(例如,在使用两个第一个组件进行可视化的情况下)?