基于求解二次方程的单变量分类方法所需的数学解释

数据挖掘 分类
2022-03-09 11:49:32

我阅读了一段关于将图像色调值分类为具有派生阈值的三类的代码。通过简单地使用二次公式来计算阈值。代码的相关文档如下:

/*
*       (v_B - v_A)x^2 + 2(m_B*v_A - m_A*v_B)x + (m_A^2*v_B - m_B^2*v_A) = 0
*
*       v_A : variance of group A
*       m_A :   mean of group A
*       v_B : variance of group B
*       m_B :   mean of group B
*
*       Quadratic formula
*       ax^2 + bx + c = 0
*       a = v_B - v_A
*       b = 2(m_B*v_A - m_A*v_B)
*       c = (m_A^2*v_B - m_B^2*v_A)
*
*       x1 = (-b+sqrt(b^2-4ac))/2a
*       x2 = (-b-sqrt(b^2-4ac))/2a
*
*/

上面是找到一个阈值来划分类别AB,基于求解一个涉及两组均值和方差的二次方程,并且阈值是取决于它们的符号的解之一(即x1和)。x2

我以前没有见过这种基于二次方程的分类方法。任何人都知道该方法的正式名称是什么?乍一看,它似乎是二次判别分析的简化案例,但对此不确定。对于该方法,我需要一点数学背景。如果你知道,请教育我。谢谢!

1个回答

其实推导很简单。

提示 1:您最有可能在哪里找到使用的均值和方差?高斯!

提示 2:你将如何使用高斯进行分类?很简单,您将高斯拟合到每个组并比较新数据的 PDFx. 更简单的是,您将高斯拟合到每个组并计算马氏距离x到每个组。


阈值称为阈值,因为在此值下,您无法分辨它属于哪个类,也就是马氏距离到两组相等:

(xμA)2σA2=(xμB)2σB2

展开这个,你会得到二次公式。