我正在从事一个公司项目,我需要将数据划分为 3 个部分 - 训练、验证和测试(保留)。
有谁知道我如何将数据分成上面的 3 个部分,每个部分将具有相似的响应变量(目标率)-(相似的分类精度和相似的回归平均值(响应)。
我知道如何使用 SKLEARN 中的 train_test_split 函数将数据分成 3 部分
from sklearn.model_selection import train_test_split
x, x_test, y, y_test = train_test_split(xtrain,labels,test_size=0.2,train_size=0.8)
x_train, x_cv, y_train, y_cv = train_test_split(x,y,test_size = 0.25,train_size =0.75)
但这并没有给出类似的目标率,有人可以帮我吗?