tSNE 图中的长形线

数据挖掘 特纳
2022-02-25 19:06:41

我的问题与这篇文章类似:长曲线形 t-SNE 是什么意思?

但问题是我的数据不是时间序列,但我在 tSNE 图中也得到了这些长形线。

在此处输入图像描述

我不知道这意味着什么或如何摆脱它。我怀疑数据中的某些结构导致了这种情况。但是我找不到有用的资源来解释数据中的什么结构可能导致这种情况。

我的数据是单细胞数据,每一行是一个细胞,每一列是一个生物标记(例如CD3,CD4),所以数据是每个细胞上的标记表达。

1个回答

欢迎来到大立德社区!

您的数据中有一个顺序模式。作为一个非生物信息学的人,我只是在谷歌上搜索了一下,发现生物标志物也被广泛用于学习疾病的进展(例如阿尔茨海默病)。我希望我对示例的看法是正确的,如果我是正确的,那么您看到那些可能表明某事进展的曲线也就不足为奇了。如果您需要更准确的答案,您最好提供有关数据来源的更多信息(或者如果数据是公开的,则提供指向您的数据的链接)。

从 ML 的角度来看,我幸运地知道一点,tSNE 中的那些曲线是由顺序模式引起的。

有趣:作为一个同样令人惊讶的例子,有一次我在不同葡萄酒的特征中发现了顺序模式!(每行一个葡萄酒,每列一个葡萄酒属性,如酒精百分比、密度等)