下面的代码有什么问题?

数据挖掘 机器学习 Python 过拟合 卡格尔
2022-03-15 19:18:27

我一直在做一个我从kaggle. 我没有得到网站上提到的结果。我在这里做错了什么?

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

train = pd.read_csv('../data/dont-overfit/train.csv')
test = pd.read_csv('../data/dont-overfit/test.csv')

train[train.columns[2:]].std().plot('hist')

train[train.columns[2:]].mean().plot('hist')
plt.title('Distribution of means/stds of all columns')

plt.show()

print(train.isnull().any().any())

print('Distribution of first 28 columns')
plt.figure(figsize=(26,24))
for i, col in enumerate(list(train)[2:30]):
    plt.subplot(7, 4, i+1)
    plt.hist(train[col])
    plt.title(col)

plt.show()

这是帖子

1个回答

代码似乎可以绘制分布。让我知道确切的错误。

在此处输入图像描述