我有一个关于变量跟随或不是随机分布的问题。我选择了 4 个与标签负相关的特征(欺诈/无欺诈)。我从中获得灵感的笔记本绘制了关于标签的这些特征的分布。结果是我的功能 1(仅限欺诈)遵循正态分布。
这是我的问题:
- 为什么知道我的特征是否遵循正态分布很重要?-> 我的猜测:有些模型需要它来加快收敛或获得更好的结果
- 是否有兴趣将我的功能可视化为非欺诈与欺诈并比较分布?
- 如果我的特征不遵循正态分布但被缩放,我是否仍应将它们强制为类似高斯的形状?
非常感谢你 !
我有一个关于变量跟随或不是随机分布的问题。我选择了 4 个与标签负相关的特征(欺诈/无欺诈)。我从中获得灵感的笔记本绘制了关于标签的这些特征的分布。结果是我的功能 1(仅限欺诈)遵循正态分布。
这是我的问题:
非常感谢你 !