我很想知道改组 ML 训练数据是否有助于获得更好的结果?
抱歉,这里没有太多智慧,但我一直在阅读pythonprogramming.net 上关于这个主题的帖子。
我从帖子中复制了这个函数并修改为只是将我的洗牌数据保存到 csv 文件中。
def Randomizing():
df2 = df.reindex(np.random.permutation(df.index))
df2.to_csv('C:\\Users\\Machine-Learning-Electric-Data\\randomized.csv')
Randomizing()
似乎发生的只是索引被打乱,所有其他数据保持不变。我的 pd 数据框中有很多列,我需要保持所有行相同。(随机打乱所有行,它的时间序列数据)如果这是有益的,有人可以给我一个关于如何随机打乱我的数据而不仅仅是索引的提示吗?