我的一些数据特征的值很大,而其他特征的值要小得多。
在应用 t-SNE 之前是否有必要对数据进行中心+缩放以防止偏向较大的值?
我使用 Python 的 sklearn.manifold.TSNE 实现和默认的欧几里得距离度量。
我的一些数据特征的值很大,而其他特征的值要小得多。
在应用 t-SNE 之前是否有必要对数据进行中心+缩放以防止偏向较大的值?
我使用 Python 的 sklearn.manifold.TSNE 实现和默认的欧几里得距离度量。
居中无关紧要,因为该算法仅对点之间的距离进行操作,但是如果您希望以同等重要性对待不同的维度,则需要重新缩放,因为 2 范数将受到较大方差维度的更大影响。