我对使用线性判别分析发现的一些东西感到困惑。这就是问题所在——我首先使用 20 个左右的自变量运行判别分析来预测 5 个段。在输出中,我要求预测段,大约 80% 的情况与原始段相同。然后我再次使用相同的自变量运行判别分析,但现在尝试预测预测段。我原以为我会得到 100% 的正确分类率,但这并没有发生,我不知道为什么。在我看来,如果判别分析不能以 100% 的准确度预测它自己的预测段,那么不知何故,它不是一个最佳程序,因为存在一个可以获得 100% 准确度的规则。我错过了什么?
注意 - 这种情况似乎与线性回归分析中的情况相似。如果你适合模型并使用与您将获得的相同数据的估计方程[]。现在如果你估计模型,你会发现同样的和和以前一样,没有错误,并且 R2 = 100%(完美拟合)。我虽然线性判别分析也会发生这种情况,但事实并非如此。
注 2 - 我在 SPSS 中使用判别分析运行此测试。