LDA:线性判别分析
假设我们有一个分类问题。我了解数据可以是特征可能具有离散值或连续值。
假设我们的数据包含连续的特征值。然后我们可以使用分布应用朴素贝叶斯。让我们假设数据是正态分布的,因此使用正态分布的朴素贝叶斯。我们也可以应用同样使用正态分布的 LDA。
使用朴素贝叶斯,我们假设特征是独立的,通过使用 LDA,我们假设所有类的协方差相同。
这些假设如何使这两个模型表现不同,哪个是更好的模型以及在哪些条件下?
LDA:线性判别分析
假设我们有一个分类问题。我了解数据可以是特征可能具有离散值或连续值。
假设我们的数据包含连续的特征值。然后我们可以使用分布应用朴素贝叶斯。让我们假设数据是正态分布的,因此使用正态分布的朴素贝叶斯。我们也可以应用同样使用正态分布的 LDA。
使用朴素贝叶斯,我们假设特征是独立的,通过使用 LDA,我们假设所有类的协方差相同。
这些假设如何使这两个模型表现不同,哪个是更好的模型以及在哪些条件下?
据我所知,高斯 LDA 和高斯朴素贝叶斯都假设特征服从正态分布。然而,GNB 对特征独立性提出了更强的假设,而高斯 LDA 不要求特征独立。看到这个。