我是机器学习的新手,当我了解线性判别分析时,我看不出它是如何用作分类器的。
我可以理解 LDA 和 PCA 之间的区别,并且可以看到 LDA 如何用作降维方法。我已经阅读了一些关于 LDA 分类的文章,但我仍然不确定 LDA 是如何用作分类器的。
据我了解,我们将特征向量x
视为多元高斯分布,并使用贝叶斯规则来计算哪个类别给出最大概率x
,然后它属于该类别。
这种理解一般正确吗?
我是机器学习的新手,当我了解线性判别分析时,我看不出它是如何用作分类器的。
我可以理解 LDA 和 PCA 之间的区别,并且可以看到 LDA 如何用作降维方法。我已经阅读了一些关于 LDA 分类的文章,但我仍然不确定 LDA 是如何用作分类器的。
据我了解,我们将特征向量x
视为多元高斯分布,并使用贝叶斯规则来计算哪个类别给出最大概率x
,然后它属于该类别。
这种理解一般正确吗?
我在以下位置找到了答案:https ://machinelearningmastery.com/linear-discriminant-analysis-for-machine-learning/
使用 LDA 进行预测
LDA 通过估计一组新输入属于每个类的概率来进行预测。获得最高概率的类是输出类并进行预测。
该模型使用贝叶斯定理来估计概率。简要地说,贝叶斯定理可用于使用每个类的概率和数据属于每个类的概率来估计给定输入 (x) 的输出类 (k) 的概率:
P(Y=x|X=x) = (PIk * fk(x)) / sum(PIl * fl(x))
其中 PIk 是指在您的训练数据中观察到的每个类别 (k) 的基本概率(例如,对于两类问题中的 50-50 拆分为 0.5)。在贝叶斯定理中,这称为先验概率。
PIk = nk/n
上面的 f(x) 是 x 属于该类的估计概率。f(x) 使用高斯分布函数。将高斯代入上述方程并简化我们最终得到下面的方程。这称为判别函数,计算出的类具有最大值将是输出分类 (y):
Dk(x) = x * (muk/siga^2) – (muk^2/(2*sigma^2)) + ln(PIk)
Dk(x) 是给定输入 x 的 k 类的判别函数,muk、sigma^2 和 PIk 都是根据您的数据估计的。
所以是的,它使用贝叶斯定理来估计概率。