数据挖掘 - 如何测试特征对转换的影响？ - 吾爱随笔录

数据挖掘统计数据

2022-03-02 03:04:27

我有一个用户旅程，其中有以下格式的数据：

用户 ID、did_interact_with_feature(0/1)、did_convert(0/1)

我想验证这样一个假设，即如果用户正在使用该功能，他更有可能获得转化。

现在我可以获得参与功能然后被转换的用户的百分比。但我似乎在这里遇到了心理障碍。

我倾向于进行 z 检验，但无法制定问题。

任何帮助都非常感谢。

1个回答

好的，感谢这篇文章，我能够对此进行测试。我们需要的检验是近似结果的卡方检验和精确变量的 Fischer 检验。

鉴于我所拥有的变量本质上是分类的（参与：是/否和转换：是/否），基本假设是正确的。

现在，首先我为每个参与和转换的人创建了列联表，参考这里。

之后，计算表中每个单元格的期望值。注入公式，瞧，我得到了卡方谷。进一步与卡方值表比较得到p值。

这导致测试变量是否独立。

这是最终结果的样子：

其它你可能感兴趣的问题