我不确定这种类型的数据叫什么,所以我将举例说明我正在使用的数据类型:
- 一个城市每小时记录其不同类型车辆的流入和流出。更具体地说,它记录引擎大小。输出将是记录的每小时间隔后 X 小时的污染水平。
值得注意的是,数据由单个车辆发动机大小组成,因此无法汇总。这意味着 2 个输入向量(流入和流出)的长度是可变的(每小时会有不同数量的车辆进入和驶入),我不知道如何处理这个问题。我可以汇总并简单地总结车辆数量,但我想保留数据中的任何模式。例如,可能有几个重型摩托车发动机快速接连出现,表示一个骑自行车的团伙刚刚进入城市并且以肆无忌惮地骑行而闻名,对污染的贡献大于其部分的总和。
任何见解都值得赞赏。