数据挖掘 - 采用混合采样率输入的架构 - 吾爱随笔录

数据挖掘时间序列数据集数据清理卷积神经网络

2022-03-03 13:42:46

假设一个模型是在多个一维时间序列的数据集上训练的。这些数据集是以不同的采样率收集的。我计划使用卷积神经网络来处理这些时间序列进行分类。

我的问题是，在这种情况下，我可以对数据或模型本身做些什么来使其“意识到”采样频率？我天真地尝试过将它们一起训练，我得到了一个好的结果。有没有现成的作品？我试着用谷歌搜索，但到目前为止没有发现任何值得注意的东西。

我对重新采样数据犹豫不决，因为我不想通过使插值方法成为超参数来意外删除/引入重要信息。

1个回答

网上一搜，没找到满意的答案，于是想了个办法。我进行了测试，它给出了相当不错的准确性。这种方法的灵感来自于这篇论文。

与论文中的方法类似，我首先选择要使用的卷积核的数量，然后根据数据点的采样率，使用卷积核集的凸包对其进行卷积。

那么我究竟是如何计算重量的呢？有很多超参数，但我所做的是通过划分预期的采样频率范围为每个内核分配一个采样率。然后我减去输入数据点的采样率，看看哪个内核最接近它。然后我对绝对差值进行最小化处理，以确保得到的权重加起来为 1。

这里有很多事情要做：我们是否统一分配费率？一组中使用多少个内核？重量是怎么计算的？...

其它你可能感兴趣的问题