可视化具有多个解释变量的支持向量机 (SVM)

数据挖掘 机器学习 分类 r 可视化 支持向量机
2021-10-13 23:47:49

我想知道是否有人知道任何可视化具有三个以上连续解释变量的 SVM 模型的方法。在我的特殊情况下,我的响应变量是二项式的,有 6 个连续解释变量(预测变量),一个分类解释变量(预测变量)。我已经减少了预测变量的数量,我主要使用 R 进行分析。

(我不知道这样的任务是否可能/值得追求。)

谢谢你的时间。

3个回答

以 SVM 的形式创建模型是否重要?

如果不是,我已经看到了一个巧妙的 6-D 可视化。它的品种在医学展示中越来越受欢迎。3 个维度像往常一样以正交投影显示。维度 4 是颜色 (0..255) 维度 5 是符号的厚度 维度 6 需要动画。它是屏幕上一个点的振动频率。在静态印刷版本中,可以通过点周围的模糊来代替振动频率,以获得可比较的视觉感知。

如果是,并且您特别需要绘制分离的超平面,并使它们看起来像线\平面,则前面的技巧不会产生好的结果。多个 3-D 图像更好。

你有没有研究过 R 中的 tourr 包。这个包做了超平面减少。此外,它还有一个优化器,试图找到最好的减少。

https://www.youtube.com/watch?v=iSXNfZESR5I中有一段非常棒的视频,它显示了 R 甚至超出了 tourr 包的能力。

另外我建议您参考https://stackoverflow.com/questions/8017427/plotting-data-from-an-svm-fit-hyperplane

降维(如 PCA)是在高维特征空间上可视化分类结果的绝佳方法。

最简单的方法是将特征投影到一些低维(通常是二维)空间并绘制它们。然后要么将决策边界投影到空间上并绘制它,要么根据预测的类别简单地对点进行着色/标记。你甚至可以使用形状来表示真实类别,使用颜色来表示预测类别。

对于任何分类分类器都是如此,但这里有一个特定于 SVM 的示例: http: //www.ece.umn.edu/users/cherkass/predictive_learning/Resources/Visualization%20and%20Interpretation%20of%20SVM%20Classifiers.pdf

具体而言,参见图 1a 和 2a。