所以让我们开始吧!
首先,请查看我对您的原始问题所做的编辑。这不仅仅是一个编辑,而是暗示了重要的概念性事物,所以我需要从它们开始:
- 图形:图形是数学中用于类网络对象的保留术语。为了清楚起见,您最好使用“绘图”一词。所以这个问题绝对不是关于图表的。
- Time-series data:您制作的示例,即数据点的时间序列称为Time-series。n 维数据不一定是时间序列,但是两者似乎都抑制了相同的结构,它们在概念上是不同(但不一定不相关)的数据类型,并且为它们定义了不同的算法和问题集,所以请评论此处数据是否为时间序列。
- 曲线图:最后但并非最不重要的是,曲线图仅用于说明数据,所有数据分析算法和方法都使用该数据进行推理。所以你永远不会从情节本身推断出任何东西,而是从它所描绘的数据中推断出来。如果您有任何类似绘图的数据,但您不知道您需要使用图像处理背后的数据,我很确定这不是这个问题的主题,但在您明确询问如何进行分析时想提及情节自己。
在这些点之后,我回到你的问题。是的,您正在寻找的是模式识别,您可以使用许多机器学习方法来解决您的问题。如果您已经知道什么是不同的模式类别,则称为分类,但现在,据我了解,您不知道类别,而是想找到相似的模式。在数据中寻找相似性模式称为聚类。
因为我不知道您的数据是时间序列(例如下雨量与时间)还是只是结构化的 n 维数据(例如下雨量与湿度),所以我两者都尝试。
时间序列
当您有不同的时间序列片段并且您需要它们的相似性时,您可以使用相关分析或动态时间规整。如果时间序列是高频的,例如语音数据或EEG,那么您最好将数据转换为频域(或时频)域,然后从这些片段中提取特征,然后使用这些特征来确定相似度。请注意,术语相似性非常广泛,它是根据数据和问题的性质定义的。您可以搜索时间序列聚类以获取更多方法。
非时间数据
拟合这些数据子集的回归模型的参数之间的相似性可能会有所帮助。另一种方法是将聚类算法应用于这些段。这些算法可以应用于原始数据子集或从中提取的一些特征。像PCA这样的降维算法可用于特征提取,可能有助于更好的聚类。
我匆忙写下了我的答案,因此我将不胜感激任何评论或进一步的问题。
祝你好运!