我正在努力预测(不解释)通常只有大约 10%“1”的 0/1 结果(我不能随意命名变量)。N ~40,000。无论是在使用大约 5-10 个主效应时,还是在我建立了 CHAID 程序建议的几个交互项之后,逻辑回归都被证明是不令人满意的。灵敏度最终只有大约 25%。
然后我转向神经网络(SPSS 中的径向基函数网络)。看到程序未能将任何案例归类为“1”,我感到非常震惊。也就是说,灵敏度为零。 第一个问题:在这些条件下,这是一个常见的或可以理解的 NN 结果吗?
接下来我尝试在训练集中随机排除大量“0”的情况,使“1”的比例达到40%左右。现在,该程序能够正确识别训练集中一半数量的案例,灵敏度约为 30%,但当该解决方案应用于测试集时,灵敏度下降到 20%,测试集再次仅包含约 10 个%“1”。
第二个问题:您将如何解决这个问题?