我们正在从 EEG 中提取特征,这是一个时间相关的信号。
我们有超过 64 个通道的 10,000 个数据点的信号,每个通道的每个时间戳提取 10 个特征,所以最后我们有一个每个时间步长的 64x10 特征的特征数据集。
我们正在应用 PLS 来回归手部运动 (X,Y,Z)。
我们正在使用交叉验证来验证结果,但我们的一些同事指出,使用数据集中的交错采样感觉像是在作弊。
他们的建议是使用 2/3 的连续数据进行训练,使用 1/3 的数据进行测试。
我想听听关于这个设置的总体意见,我的直觉告诉我,因为它是时间相关的数据,所以像这样划分数据集会产生不好的结果(确实如此)