如何对这个时间序列数据进行分类和聚类

数据挖掘 数据挖掘 分类 数据集 聚类 时间序列
2021-09-24 11:28:28

几个月前我已经发布了关于我开始工作的项目的问题。这篇文章可以在这里看到: 使用智能手机数据集的人类活动识别问题

现在,我知道这是基于多元时间序列分析,任务是对数据进行分类和聚类。我已经为此收集了一些材料(电子书、教程等),但仍然无法更详细地了解我应该如何开始。这是看起来可能会有所帮助的教程,但问题是我的数据看起来不同,我不确定这是否可以应用于我的工作。

http://little-book-of-r-for-multivariate-analysis.readthedocs.org/en/latest/src/multivariateanalysis.html#scatterplots-of-the-principal-components

所以基本上,我的问题是:

我如何开始一些非常基本的分析?如何读取数据,所以它对我有任何意义。任何提示和建议将不胜感激!注意:我只是数据科学的初学者。

2个回答

我在Data Science StackExchange上最近的一个回答中分享了许多关于时间序列分类和聚类的资源:https ://datascience.stackexchange.com/a/3764/2452 。希望您会发现它们与这个问题相关并且有用。

我如何开始一些非常基本的分析?

获取您的标记数据并计算每个集合的值的直方图。绘制这些图并直观地查看是否有任何差异。还要计算每个不同标记集的均值和方差,看看是否存在差异。

如果是时间序列数据,则采用小的(重叠)时间窗口并计算各种指标——例如最小值、最大值、方差、平均值——并将其用作分类器的输入。