问题陈述 -我必须找到所有用户的平均功能使用情况和用户 X 的使用情况,以建议他是否应该使用该功能。
示例 - 在谷歌主页上,用户平均 85% 的时间使用搜索按钮。如果用户 X 来到主页并根据他的活动,我们计算出只有 35% 的时间他点击了搜索按钮。我们想通知他搜索按钮的好处。
数据我们有——
User | Landed on home page | used search button
1 1000 100
2 100 10
3 1 1
4 10 10
5 10000 1
问题-
如何消除用户 5,因为这会使数据异常倾斜。中位数可能是该用例的解决方案。有没有更好的建议?
如何找到平均使用量,我的意思是 1/1(用户 3)和 10/10(用户 4)不一样,即 10/10(用户 4)应该比 1/1(用户 3)有更多的价值
如果这些用户(USER 1-5)在 1 个月后停止访问主页,那么平均使用量仍然相同——这是错误的。由于它是较早使用但不是最近使用,因此使用平均值应该会衰减。
因此,除了上述问题之外,我的问题是,我是否朝着正确的方向前进?是否有任何内置算法或工具可用于问题陈述?任何新方法都是最受欢迎的。