抱歉,如果这是一个非常广泛的问题,我想知道 A/B 测试(或其他方法)在有效测量设计决策的影响方面有多有效。
例如,我们可以分析用户交互或点击结果、购买/浏览决策,然后修改/定制呈现给用户的结果。
然后,我们可以通过让 10% 的用户随机使用替代模型来测试这种设计更改的有效性,但是这有多客观呢?
我们如何避免通过模型更改影响用户,例如,我们可以确定“大卫贝克汉姆”的搜索查询可能与足球有关,因此搜索结果会偏向于此,但我们同样可以说他的生活方式同样相关,但这永远不会进入返回的前 10 个结果。
我很好奇这是如何处理的以及如何有效地衡量这一点。
我的想法是,您可能会面临推动您认为正确且用户有义务的模型的危险,这将成为一个自我实现的预言。
我读过一篇关于这个的文章:http: //techcrunch.com/2014/06/29/ethics-in-a-data-driven-world/还有这本书:http ://shop.oreilly.com/ product/0636920028529.do对此进行了讨论,因此引起了我的兴趣。