l 有一个包含 10 个类的 200 个示例的数据集。l 想把数据集分成50%的训练集和50%的测试集。
对于每个班级,我有 20 个例子。因此,我想为每个类获得:10 个训练示例和 10 个测试示例。
这是我的课程:
classes=['BenchPress', 'ApplyLipstick', 'BabyCrawling', 'BandMarching', 'Archery', 'Basketball', 'ApplyEyeMakeup', 'BalanceBeam', 'BaseballPitch', 'BasketballDunk']
我尝试了以下方法:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(final_data, true_label, test_size=0.50, random_state=42)
然而,它返回一个 50% 的训练集和 50% 的测试集,而不考虑每个类的比例(我希望每个类在测试集中获得 10 个示例,在训练集中获得 10 个示例)。这是结果拆分:
