如何评估函数中变量的“重要性”

数据挖掘 可解释的ai 预测重要性
2022-02-14 22:59:54

假设我们有

f(x,y,z)=x/k(y/k)((zx/k)/(zy/k))
k=constant]0,1[

我需要以某种方式表明变量x在某些指标中更重要,我不知道哪一个可能是好的。我考虑过分析该函数的偏导数,但我认为这不是一个好方法,因为人们只会看到一些通过表面的受限路径。

另一种方法是在某个感兴趣的领域进行蒙特卡罗模拟(它存在,实际上是一个现实世界的问题),并看到函数值的方差增加更多不同的 x 固定另一个变量而不是相同的模拟x固定的。

在某种程度上,可以将此函数视为模型,我需要计算变量重要性,它也可能是一种方法。

但我真的很困惑如何解决这个问题。

欢迎任何指标或某种方法!

非常感谢你!

1个回答

开始的方法是直观地理解是什么让某些变量变得重要

例如,函数的输出值可能在很大程度上取决于该变量的值(因此输出和该变量之间的相关性会非常高)。

另一个例子是使该变量为零并测量原始函数和新函数之间的相关性(例如,它将表现出低相关性)。

还有一种方法是计算函数相对于每个变量的变化率(导数)的变化率(导数),并查看该变量的小扰动对函数输出的影响程度。

类似的其他方法也是可能的。由于您有函数 wrt 的公式,因此上述方法之一很好。

变量/特征重要性没有一致的通用度量标准,但是可以根据手头的问题采取各种方法。

进一步阅读:

  1. 变量重要性分析:综合回顾

  2. 评估任意类型预测模型的变量重要性

  3. 变量重要性度量

  4. 量化变量重要性的方法:对嘈杂生态数据分析的意义