我是数据科学和机器学习的新手。我正在研究一个分类问题,其任务是预测贷款状态(授予/未授予)。
我正在对数据运行逻辑回归模型。我的模型的准确率为 82%。但是,我的模型更敏感(敏感度 = 97%)且特异性较低(特异性 = 53%)。
我想增加模型的特异性。在这个阶段,在参考了一堆互联网资源后,我对如何进行感到困惑。
以下是我的观察:在测试数据中,
类标签中 1 的百分比是 73.17073170731707。
测试数据在类标签中的 1 多于 0。这是模型高度敏感的原因吗?
我附上了我的数据文件和代码文件。请看一下。
数据样本:
流程:数据-->缺失值插补-->分布分析-->对数变换为正态分布-->一次热编码-->特征选择-->拆分数据-->模型选择与评估
代码片段:
在这里,我选择了“3 个最佳功能”:信用记录、物业区域
我应该如何进行?任何帮助(即使它只是朝着正确的方向踢球)将不胜感激。



