我目前必须处理具有相同类型模式的多个时间序列数据集。我的任务是找到一种方法来正确标记这些数据点(或可能是间隔)。下面是数据集的样子:
Time Value
2012-04-30T08:52 1.06
2012-04-30T08:53 0.82
2012-04-30T08:54 0.65
2012-04-30T08:55 1.12
2012-04-30T08:56 1.09
2012-04-30T08:57 0.65
*仅供参考
目标是能够将输入时间序列从测量中分割成一致的线性补丁(即没有显示任何规模活动)。
然后从分段的时间序列中,需要测量每个段的开始/结束时间(以及持续时间),并将这些段分类为“活动”,例如:
-无托盘(恒定)
-空闲(恒定)
- 拿取物品(价值减少)
-放置项目(价值增加)
-工作(恒定)
所以,我有两种方法来解决这个问题,但我没有信心,因为这是我第一次遇到这样的问题。
- 我的第一种方法是手动标记数据集并为这个问题找到合适的算法。但是,我相信当测量结果完全不同时,它不会产生好的结果。
- 我的第二种方法是机械地设置多个范围和阈值来确定结果。但是,我的第一种方法似乎仍然存在同样的问题。总而言之,我认为这个问题并不新鲜,应该已经有人遇到过这种问题。所以,我在这里发帖希望得到一些好的建议。

