我正在考虑添加另一个名为“测试/训练”的列,其中 0 表示测试,1 表示训练数据,然后当我收集数据时,结束训练数据收集阶段并开始输入每行 1那一栏。然后使用选择行小部件选择“测试/训练”= 0 或 1 的所有行。但是,在 PCA 下,原始列消失了,所以这不起作用!
那么,我可以只选择行 id > k 的所有行吗?我需要这个,因为过去的数据应该预测一小部分未来的数据,所以我想确保它有效,而不仅仅是从训练数据中随机选择测试集(这是测试和分数中的一个选项)。
我正在考虑添加另一个名为“测试/训练”的列,其中 0 表示测试,1 表示训练数据,然后当我收集数据时,结束训练数据收集阶段并开始输入每行 1那一栏。然后使用选择行小部件选择“测试/训练”= 0 或 1 的所有行。但是,在 PCA 下,原始列消失了,所以这不起作用!
那么,我可以只选择行 id > k 的所有行吗?我需要这个,因为过去的数据应该预测一小部分未来的数据,所以我想确保它有效,而不仅仅是从训练数据中随机选择测试集(这是测试和分数中的一个选项)。
实际上,我可以添加一个字符串列,并且即使使用 PCA 也应该仍然能够执行行选择技巧。在文件小部件中,您将该列设置为文本/元,它显示在前进行选择小部件中。
我认为这会奏效。