数据挖掘 - 拆分数据时，如何在每个类的训练集中获得 50% 的示例和在测试集中获得 50% 的示例？ - 吾爱随笔录

l 有一个包含 10 个类的 200 个示例的数据集。l 想把数据集分成50%的训练集和50%的测试集。

对于每个班级，我有 20 个例子。因此，我想为每个类获得：10 个训练示例和 10 个测试示例。

这是我的课程：

classes=['BenchPress', 'ApplyLipstick', 'BabyCrawling', 'BandMarching', 'Archery', 'Basketball', 'ApplyEyeMakeup', 'BalanceBeam', 'BaseballPitch', 'BasketballDunk']

我尝试了以下方法：

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(final_data, true_label, test_size=0.50, random_state=42)

然而，它返回一个 50% 的训练集和 50% 的测试集，而不考虑每个类的比例（我希望每个类在测试集中获得 10 个示例，在训练集中获得 10 个示例）。这是结果拆分：

拆分数据时，如何在每个类的训练集中获得 50% 的示例和在测试集中获得 50% 的示例？

示例代码：