我试图建立一个模型来预测特定变量的计数。用于此目的的模型是泊松。不幸的是,我没有足够的统计知识来分析模型性能。如果有人可以提供一些见解了解模型的性能以及提高模型性能的一些调整将非常有帮助。如果性能更好,我也愿意尝试其他型号。
我正在使用带有 statmodels 包的 python 来构建模型。
附上显示拟合值和实际值的图表(绿色显示实际值,蓝色显示拟合值)
Generalized Linear Model Regression Results
==============================================================================
Dep. Variable: Work_Item_Type No. Observations: 581
Model: GLM Df Residuals: 574
Model Family: Poisson Df Model: 6
Link Function: log Scale: 1.0
Method: IRLS Log-Likelihood: -16752.
Date: Mon, 22 Feb 2016 Deviance: 31268.
Time: 21:59:12 Pearson chi2: 1.05e+05
No. Iterations: 9
===============================================================================
coef std err z P>|z| [95.0% Conf. Int.]
-------------------------------------------------------------------------------
Intercept 2.8492 0.051 55.426 0.000 2.748 2.950
Weekday -0.2066 0.032 -6.446 0.000 -0.269 -0.144
day_of_week -0.0926 0.007 -13.367 0.000 -0.106 -0.079
wom 0.1122 0.007 16.996 0.000 0.099 0.125
week -0.0411 0.001 -53.597 0.000 -0.043 -0.040
TimeDelta 0.0001 5.1e-05 2.933 0.003 4.96e-05 0.000
month_of_yr 0.2192 0.004 60.981 0.000 0.212 0.226
===============================================================================
Also attaching a sample of the dataset used
clear_date Count_Work_Item_Type
7/7/2014 1
7/10/2014 1
7/11/2014 5
7/17/2014 2
7/22/2014 1
7/24/2014 1
7/29/2014 3
7/30/2014 4
8/13/2014 1
因为我只有日期和要预测的变量,所以我创建了一堆其他变量,比如
Weekday(binomial)?
Day of week
Week of Month
Week
Time Delta (Starts from 0 increment by one until end)
Month of Year
此外,我还没有对变量进行任何类型的转换。如果您需要更多信息,请发表评论:谢谢
