数据挖掘 - 下面的代码有什么问题？ - 吾爱随笔录

我一直在做一个我从kaggle. 我没有得到网站上提到的结果。我在这里做错了什么？

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

train = pd.read_csv('../data/dont-overfit/train.csv')
test = pd.read_csv('../data/dont-overfit/test.csv')

train[train.columns[2:]].std().plot('hist')

train[train.columns[2:]].mean().plot('hist')
plt.title('Distribution of means/stds of all columns')

plt.show()

print(train.isnull().any().any())

print('Distribution of first 28 columns')
plt.figure(figsize=(26,24))
for i, col in enumerate(list(train)[2:30]):
    plt.subplot(7, 4, i+1)
    plt.hist(train[col])
    plt.title(col)

plt.show()

这是帖子