我一直在使用连体神经网络对生物数据进行二元分类。我正在使用的数据集的每个条目都有一个位置坐标。
我的问题是,即使我的神经网络能够对空间上接近训练集的数据集进行出色的预测,它也无法对更远的数据集进行同样的预测。
我正在使用一种保留(无 k 折交叉验证)优化方法:该算法读取输入数据集,并将其拆分为包含 80% 输入元素的训练集和包含剩余 20 个元素的验证集% 的输入元素。
该算法使用训练集训练神经网络,然后将训练好的模型应用于保留的验证集。通过这样做,该算法能够在验证集上获得出色的预测分数(例如Matthews 相关系数>= 0.9)。
相反,当我尝试将训练有素的孪生神经网络应用于与训练集不相邻的测试集时,问题就出现了。在这些情况下,我的预测分数变得非常糟糕(MCC ~= +0.1)。
有人可以帮我弄这个吗? 我应该怎么做才能解决这个问题? 谢谢
