有没有办法从雷达(蜘蛛)图表计算价值?

数据挖掘 统计数据 回归 可视化 相关性 预言
2022-02-15 06:01:10

所以我目前正在为“销售人员”做一个项目。从本质上讲,用户向我们提供了大量与他们试图赢得的交易相关的信息。我们拥有与交易价格、交易利润、参与交易的人数、参与交易的人员的能力以及交易风险相关的数据。我想根据给定的指标为这些交易分配一个“分数”,并以一种简单的方式可视化分数的计算方式。

很容易将这一切可视化为雷达(蜘蛛)图(我知道传统雷达图的功能有限,因为指标的顺序是任意的,并且由蜘蛛图形成的区域没有多大价值) - 但是为什么我不能从相关矩阵或回归输出中获取结果以某种方式对指标进行加权和/或根据重要性对它们进行排序?

举个例子——假设我已经根据每场比赛的得分、每场比赛的助攻、球员效率等为 NBA 球员构建了一个雷达图。如果我有一个逻辑回归输出来确定 MVP,我会使用输出来排序和加权变量(基于 p 值?)以构建雷达图。如果然后我从最近一个 NBA 赛季的数据中统计出每个 NBA 球员,那么面积最大的球员难道不是最有价值的球员之一吗?

我似乎找不到太多关于构建加权雷达图的信息——尽管我已经看到百分位数可用于实际指标。有人有任何建议或替代解决方案吗?

1个回答

您基本上希望显示模型中每个特征的重要性,因为它与您的最终分数相关。我不会从可视化开始,而是先找出数据,然后再看看哪种可视化适合。在这里,他们使用了一个简单的条形图:

http://scikit-learn.org/stable/auto_examples/ensemble/plot_forest_importances.html