数据挖掘 - 将此数据集的输入数据输入 keras 进行训练 - 吾爱随笔录

假设我有 3 个 csv 文件，它们构成了在 Keras 中训练机器学习模型的数据集。

文件 1.csv

Name, X1,       X2,         X3
Joe,  1.16,                 1.00,                   1.11
Joe,  1.19,                 1.11,                   1.17
Joe,  1.17,                 1.13,                   1.16

文件2.csv

Name, X1,       X2,         X3
Jack,   1.81,               1.23,                   1.15
Jack,   1.34,               1.53,                   1.87
Jack,   1.35,               1.64,                   1.75

文件 3.csv

Name, X1,       X2,         X3
Bo,     1.42,               1.64,                   1.43
Bo,     1.35,               1.53,                   1.32
Bo,     1.46,               1.64,                   1.53

根据数据，我会分类这个人的表现是好是坏。对于上面的数据，Joe 的表现很好，而其他人的表现很差。

在 keras 中，上述数据集将被转换为 numpy ndarraysX_train并Y_train输入model.fit()如下；

model.fit(X_train, 
          Y_train, 
          nb_epoch=5, 
          batch_size = 128, 
          verbose=1, 
          validation_split=0.1)

我对如何X_train以及Y_train应该是什么样子感到困惑。X_train和的形状应该是什么Y_train？

假设我从 csv 文件中读取了以下数据帧。

df1 = pd.read_csv(file1.csv)
df2 = pd.read_csv(file2.csv)
df3 = pd.read_csv(file3.csv)

我应该如何使用这些数据框来获取X_train和Y_train？

我正在使用 python v3，keras 和 tensorflow。