我使用 randomForest 根据 8 个变量(不同的身体姿势和运动)对 6 种动物行为(例如站立、行走、游泳等)进行分类。
randomForest 包中的 MDSplot 给了我这个输出,我在解释结果时遇到了问题。我对相同的数据进行了 PCA,并且已经在 PC1 和 PC2 中的所有类之间得到了很好的分离,但是这里的 Dim1 和 Dim2 似乎只是分离了 3 个行为。这是否意味着这三种行为比所有其他行为更不相似(因此 MDS 试图找到变量之间的最大差异,但不一定是第一步中的所有变量)?三个集群的定位(例如在 Dim1 和 Dim2 中)表明了什么?由于我对 RI 还很陌生,因此在为该图绘制图例时也遇到了问题(但是我知道不同颜色的含义),但也许有人可以提供帮助?非常感谢!!
我在 RandomForest 中添加了一个使用 ClassCenter 函数制作的图。此函数还使用邻近矩阵(与 MDS 图中相同)来绘制原型。但是仅仅通过查看六种不同行为的数据点,我无法理解为什么邻近矩阵会像它那样绘制我的原型。我还尝试了使用 iris 数据的 classcenter 函数,它可以工作。但它似乎不适用于我的数据......
这是我用于此图的代码
be.rf <- randomForest(Behaviour~., data=be, prox=TRUE, importance=TRUE)
class1 <- classCenter(be[,-1], be[,1], be.rf$prox)
Protoplot <- plot(be[,4], be[,7], pch=21, xlab=names(be)[4], ylab=names(be)[7], bg=c("red", "green", "blue", "yellow", "turquoise", "orange") [as.numeric(factor(be$Behaviour))])
points(class1[,4], class1[,7], pch=21, cex=2, bg=c("red", "green", "blue", "yellow", "turquoise", "orange"))
我的类列是第一个,然后是 8 个预测变量。我将两个最佳预测变量绘制为 x 和 y。