感谢您对我在一项分析中应用的策略的评论/帮助。简而言之,我的情况是:
1) 我的数据具有生物来源,在 120 秒内收集,来自受试者,每次都接受可能的三种刺激之一(响应标签 1 到 3),以随机方式,每秒一个刺激(试验)。采样频率为 256 Hz 和 61 个不同的传感器(输入变量)。所以,我的数据集有 120x256 行和 62 列(1 个响应标签 + 61 个输入变量);
2)我的目标是确定每个刺激是否存在潜在模式。为此,我想使用深度学习神经网络来检验我的假设,但不是以传统方式(从单个观察/行预测刺激)。
3)我的方法是划分整个数据集,在每行洗牌(避免任何时间偏差)之后,在训练和验证集(50/50)中,然后运行深度学习算法。该部门不分离试验事件 (120),因此每个训练/验证集应包含来自同一试验的数据(行)(但绝不是同一行)。如果每个刺激都有一个主导模式,则验证混淆矩阵错误应该很低。如果每次试验都有一个主导模式,则验证混淆矩阵错误应该很高。因此,验证混淆矩阵错误是我对每个刺激存在隐藏模式的指标;
如果您能就我的逻辑的有效性向我提供任何意见,我将不胜感激。我想强调的是,我并不是试图根据行输入来预测刺激。
谢谢。