如何测试特征对转换的影响?

数据挖掘 统计数据
2022-03-02 03:04:27

我有一个用户旅程,其中有以下格式的数据:

用户 ID、did_interact_with_feature(0/1)、did_convert(0/1)

我想验证这样一个假设,即如果用户正在使用该功能,他更有可能获得转化

现在我可以获得参与功能然后被转换的用户的百分比。但我似乎在这里遇到了心理障碍。

我倾向于进行 z 检验,但无法制定问题。

任何帮助都非常感谢。

1个回答

好的,感谢这篇文章,我能够对此进行测试。我们需要的检验是近似结果的卡方检验和精确变量的 Fischer 检验。

鉴于我所拥有的变量本质上是分类的(参与:是/否和转换:是/否),基本假设是正确的。

现在,首先我为每个参与和转换的人创建了列联表,参考这里

之后,计算表中每个单元格的期望值。注入公式,瞧,我得到了卡方谷。进一步与卡方值表比较得到p值。

这导致测试变量是否独立。

这是最终结果的样子: 在此处输入图像描述

参考:https ://www.socscistatistics.com/tests/chisquare2/Default2.aspx