我有一个与评估样本外预测有关的问题。
对于我的研究,我想调整与支持向量机相关的两个参数,并使用这些优化的参数来尽可能好地预测保留样本。为了评估我的模型,我显然必须将我的数据分成训练样本 (80%) 和保留样本 (20%)。在调整参数时,我也使用 10 倍 CV,但这仅涉及训练样本。
现在我认为我的方法不是超级有效,因为保持样本与训练样本的 20-80 拆分只进行了一次,因此可能太受随机性的影响。不过,我觉得这种方法用的挺多的,比如http://www.sciencedirect.com/science/article/pii/S095741740400096X
在我早期的研究中,我进行了留一法预测,其中我使用了 n-1 个观测值并预测了剩余的观测值(这样每个观测值都被预测一次,使用仅基于其他 n-1 训练的模型)观察)。但是,在我的新项目中这是不可能的,因为我还需要调整参数 n 次,这将需要太多时间,并且意味着我会丢失与这些参数值相关的解释/绘图。
简而言之:我只将训练和保留样本分开一次是一件坏事吗?有人对我目前的方法有任何意见吗?