有人可以向我解释一下马氏距离的概念吗?例如,两点 x 和 y 之间的马氏距离是多少,特别是如何解释它以用于模式识别?
什么是马氏距离,以及它如何用于模式识别?
机器算法验证
机器学习
数理统计
距离函数
2022-03-09 01:16:09
2个回答
Mahalanobis 距离用于查找一组数据中的异常值。我不知道您在哪个领域,但在心理学中,它用于识别与数据集规范的预期不“符合”的案例。例如,如果您的样本由抑郁程度较低的个体组成,而您有一两个抑郁程度非常高的个体,那么他们的马氏距离将大于预期的临界值。如果这些情况非常极端并且您认为它们不适合您的数据集,您可能希望删除这些情况。(使用提供的示例,您的样本由抑郁程度低的个体组成,因此那些抑郁程度高的一两个个体不适合其他人)。识别异常值非常重要,因为许多统计分析都具有“正态假设”,即期望您的数据呈正态分布。异常值也可能导致数据偏斜,因此也应将其删除。(除非您转换整个变量并纠正偏斜)。许多统计程序(例如 SPSS)允许您计算 M 距离和与每个分数相关联的概率以识别异常值。我可以为您提供 SPSS 说明,但我不知道您是否使用 SPSS。(除非您转换整个变量并纠正偏斜)。许多统计程序(例如 SPSS)允许您计算 M 距离和与每个分数相关联的概率以识别异常值。我可以为您提供 SPSS 说明,但我不知道您是否使用 SPSS。(除非您转换整个变量并纠正偏斜)。许多统计程序(例如 SPSS)允许您计算 M 距离和与每个分数相关联的概率以识别异常值。我可以为您提供 SPSS 说明,但我不知道您是否使用 SPSS。