是否每个数据都类似于某种形式的空间,例如流形?意思是,数据的几何(尤其是大数据)是一个流形吗?
每个数据都嵌入到某个领域吗?如果是这样,我们是否也可以说在进行降维之后的任何数据几何形状都是(nk)球体,假设 n 是降维之前数据的维度?
基本上,我很好奇每个数据的几何形状是否都是拓扑流形(更好的是,可微流形)......
是否每个数据都类似于某种形式的空间,例如流形?意思是,数据的几何(尤其是大数据)是一个流形吗?
每个数据都嵌入到某个领域吗?如果是这样,我们是否也可以说在进行降维之后的任何数据几何形状都是(nk)球体,假设 n 是降维之前数据的维度?
基本上,我很好奇每个数据的几何形状是否都是拓扑流形(更好的是,可微流形)......
并非所有数据都类似于某些流形,因为“类似于某些流形”这一短语的大多数合理含义。
在数学上,零维流形是点的集合,从技术上讲,所有有限数据集都可以被认为是零维流形。但是,我很确定这不是您提出问题时的想法。
有许多数据集的示例确实“类似于形状”,但它们所相似的形状不是拓扑流形。一个简单的例子是由字母 X 给出的平面上的点空间。这是一个非常好的空间,但不是拓扑流形。一个人当然可以生成“类似于那个形状”的数据集,如果它们“类似于那个形状”足够好,它们可能不像一个拓扑流形。
为了解决您的第三个问题,对于“位于球体上”的大多数合理含义,在任何降维过程之后,数据都必须位于某个维度的(标准)球体上,这也不是事实。
要真正证明对您的任何问题的回答是正确的,我们需要准确地确定这些数学概念的含义,但对于最直观的含义,您的问题中出现的陈述有简单的反例。