在多维缩放中,如何确定给定应力值的解的维数?据我了解,应力值与 MDS 解的维数成反比,应力值越大说明当前模型存在很多误差(即拟合不良),说明有更多维度。随机生成的坐标、变量数和变量中的类别数是否相关?
在多维缩放中,如何确定给定应力值的解的维数?
在多维缩放中,如何确定给定应力值的解的维数?
有一个压力值是不可能确定数据集的维度的。充其量,你可以评估值是低还是高(这个评估对我来说也有点问题)。
据我了解,应力值与 MDS 解决方案的维数成反比,
正确的
并且更高的应力值表明当前模型中存在很多错误(即拟合不良),
正确的
表示具有更多维度的解决方案。
不是很准确的结论。将应力视为一个函数,“维数”是该函数的输入之一。其他 [重要因素] 是您用作 MDS 模型的模型、MDS 配置(地图)中点的初始配置,甚至是相异矩阵中的行/列的顺序。因此,您将在二维空间中获得不同的应力值,例如只需更改点的初始配置![虽然这种应力值的变化与尺寸数量变化相比并不显着]
现在,如果您想找出关于应力值的最合适的维数,有一个直接的解决方案:在多维缩放中,描述维数和应力的反比关系的实用方法是计算 2 的应力,3,4...,n-1 个维度。n 是数据的原始维数。
通过“维数-应力量的碎石图”,上述计算的结果变得更加清晰易懂。以下示例来自 Cox 和 Cox (2001):
现在我们可以根据关系来决定维度的数量。这是一个权衡:更多的维度-->更低的压力(更准确的地图)和更少的维度减少(更难以可视化和解释)。
此外,适当的尺寸数量并不是仅仅根据应力值来决定的。你的目标也很重要。如果你想要一个 2D 地图,那么你选择 2-dimension,然后尽量减少压力。
不过,如果您是在暗示“压力太大”,那么我们还有另一个故事!评估压力大小的一种方法是将其与数据集的不同可能配置的平均压力值进行比较。(看看 Patrick Mair 写的“R 中的多维缩放:SMACOF”)。
随机生成的坐标、变量数和变量中的类别数是否相关?
对不起,但我不明白你问题的这一部分。
这是旧的,但可以计算每个维度的 BIC,并选择具有最低 BIC 的维度。BIC 很好,因为它考虑了主体间的可变性、模型拟合(压力)和参数复杂性。
见李 2001: