数据挖掘 - 可视化具有多个解释变量的支持向量机 (SVM) - 吾爱随笔录

可视化具有多个解释变量的支持向量机 (SVM)

数据挖掘机器学习分类 r 可视化支持向量机

2021-10-13 23:47:49

我想知道是否有人知道任何可视化具有三个以上连续解释变量的 SVM 模型的方法。在我的特殊情况下，我的响应变量是二项式的，有 6 个连续解释变量（预测变量），一个分类解释变量（预测变量）。我已经减少了预测变量的数量，我主要使用 R 进行分析。

（我不知道这样的任务是否可能/值得追求。）

谢谢你的时间。

3个回答

以 SVM 的形式创建模型是否重要？

如果不是，我已经看到了一个巧妙的 6-D 可视化。它的品种在医学展示中越来越受欢迎。3 个维度像往常一样以正交投影显示。维度 4 是颜色 (0..255) 维度 5 是符号的厚度维度 6 需要动画。它是屏幕上一个点的振动频率。在静态印刷版本中，可以通过点周围的模糊来代替振动频率，以获得可比较的视觉感知。

如果是，并且您特别需要绘制分离的超平面，并使它们看起来像线\平面，则前面的技巧不会产生好的结果。多个 3-D 图像更好。

你有没有研究过 R 中的 tourr 包。这个包做了超平面减少。此外，它还有一个优化器，试图找到最好的减少。

https://www.youtube.com/watch?v=iSXNfZESR5I中有一段非常棒的视频，它显示了 R 甚至超出了 tourr 包的能力。

另外我建议您参考https://stackoverflow.com/questions/8017427/plotting-data-from-an-svm-fit-hyperplane

降维（如 PCA）是在高维特征空间上可视化分类结果的绝佳方法。

最简单的方法是将特征投影到一些低维（通常是二维）空间并绘制它们。然后要么将决策边界投影到空间上并绘制它，要么根据预测的类别简单地对点进行着色/标记。你甚至可以使用形状来表示真实类别，使用颜色来表示预测类别。

对于任何分类分类器都是如此，但这里有一个特定于 SVM 的示例： http: //www.ece.umn.edu/users/cherkass/predictive_learning/Resources/Visualization%20and%20Interpretation%20of%20SVM%20Classifiers.pdf

具体而言，参见图 1a 和 2a。

其它你可能感兴趣的问题

上一篇什么样的数据不适合用CF做推荐？下一篇如何定义分类的混淆矩阵？