我正在尝试学习线性回归,我希望有人看看我的笔记本,看看我是否遗漏了什么。我如何才能更好地调整我的模型。
这是我的笔记本。
我从这里获取数据集,这非常简单。
%matplotlib inline
import pandas as pd
import numpy as np
from scipy import stats
import matplotlib.pyplot as plt
df = pd.read_csv('slr12.csv', names=['annual', 'cost'], header=0)
df.describe()
df.plot(kind='scatter', x='X', y='Y');

slope, intercept, r_value, p_value, std_err = stats.linregress(df['X'], df['Y'])
plt.plot(df['X'], df['Y'], 'o', label='Original data', markersize=2)
plt.plot(df['X'], slope*df['X'] + intercept, 'r', label='Fitted line')
plt.legend()
plt.show()

所以从这个趋势我们可以预测,如果你的年费很高,那么你需要的启动成本也会很高。