使用“glm”查找逻辑回归模型准确性的一种方法是查找 AUC 图。如何检查具有连续响应变量(family = 'gaussian')的回归模型是否相同?
使用哪些方法来检查我的回归模型与数据的拟合程度?
使用“glm”查找逻辑回归模型准确性的一种方法是查找 AUC 图。如何检查具有连续响应变量(family = 'gaussian')的回归模型是否相同?
使用哪些方法来检查我的回归模型与数据的拟合程度?
我建议先简要搜索一下“线性回归模型诊断”。但这里有一些我建议你检查一下:
确保令人满意地满足假设
使用散点图或分量加残差图检查独立预测变量和因变量之间的线性关系。
绘制具有标准化残差与预测值的图,并确保没有残差非常高的极值点,并且残差的分布在预测值上基本相似,并且在残差平均值之上和之下的分布基本相同,零。
您还可以将 y 轴更改为残差。该图有助于识别不等方差。
重新检查研究设计以确保独立性假设是合理的。
检索方差膨胀因子 (VIF) 或容差统计数据以检查可能的共线性。
检查潜在的影响点
检查和调整后统计数据的变化
检查必要的交互
将您的模型应用于另一个数据集并检查其性能
您可以使用来检查您的模型与训练数据的拟合程度。这将告诉您模型解释了数据方差的百分比。
与实际值相比,我建议在测试集上使用预测的 RMSE(均方根误差)。这是报告连续变量预测误差的标准方法。
我习惯于通过绘制非参数(例如核回归)或半参数估计并将其与参数拟合曲线进行比较来检查我的参数估计器的功能形式。我认为这是第一步通常比包含交互项或高阶项更快(也许更有洞察力)。
R 包 np 提供了许多不错的非参数和半参数函数,它的 Vignette 写得很好: http ://cran.r-project.org/web/packages/np/vignettes/np.pdf