请为我对统计术语的屠杀表示歉意:) 我在这里发现了一些与广告和点击率有关的问题。但是他们都没有对我理解我的等级状况有很大帮助。
有一个相关的问题是相同层次贝叶斯模型的这些等效表示吗?,但我不确定他们是否真的有类似的问题。分层贝叶斯二项式模型的另一个问题先验详细介绍了超先验,但我无法将他们的解决方案映射到我的问题
我有几个新产品的在线广告。我让广告运行了几天。那时,已经有足够多的人点击了广告,看看哪个广告获得了最多的点击。在踢掉除了点击次数最多的那个之外的所有内容之后,我让它再运行几天,看看有多少人在点击广告后实际购买了。那时我知道首先投放广告是否是个好主意。
我的统计数据非常嘈杂,因为我没有很多数据,因为我每天只卖几件商品。因此,很难估计有多少人在看到广告后购买了东西。每 150 次点击中只有大约 1 次会促成购买。
一般来说,我需要通过某种方式将每个广告组的统计数据与所有广告的全局统计数据进行平滑处理,从而尽快知道我是否在每个广告上都在亏损。
- 如果我等到每个广告都看到足够多的购买量,我就会破产,因为它花费的时间太长:测试 10 个广告我需要多花 10 倍的钱,这样每个广告的统计数据才能足够可靠。到那时我可能已经赔钱了。
- 如果我对所有广告进行平均购买,我将无法剔除那些效果不佳的广告。
我可以使用全球购买率(N$ 子分布?这意味着我拥有的每个广告的数据越多,该广告的统计数据就越独立。如果还没有人点击广告,我认为全球平均水平是合适的。
我会为此选择哪个发行版?
如果我在 A 上点击了 20 次,在 B 上点击了 4 次,我该如何建模?到目前为止,我发现二项式或泊松分布在这里可能有意义:
purchase_rate ~ poisson
(?)(purchase_rate | group A) ~ poisson
(仅估计A组的购买率?)
但是接下来我该怎么做才能实际计算purchase_rate | group A
. 如何将两个发行版连接在一起以对 A 组(或任何其他组)有意义。
我必须先拟合模型吗?我有可以用来“训练”模型的数据:
- 广告 A:352 次点击,5 次购买
- 广告 B:15 次点击,0 次购买
- 广告 C:3519 次点击,130 次购买
我正在寻找一种方法来估计任何一个组的概率。如果一个组只有几个数据点,我基本上想回退到全球平均水平。我对贝叶斯统计有所了解,并阅读了很多人的 PDF 文档,这些人描述了他们如何使用贝叶斯推理和共轭先验等进行建模。我认为有一种方法可以正确地做到这一点,但我无法弄清楚如何正确地建模它。
对于帮助我以贝叶斯方式提出问题的提示,我会非常高兴。这将有助于在网上找到我可以用来实际实现的示例。
更新:
非常感谢您的回复。我开始越来越了解我的问题。谢谢!让我问几个问题,看看我现在是否更好地理解了这个问题:
所以我假设转换是作为 Beta 分布分布的,而 Beta 分布有两个参数,和.
这 参数是超参数,所以它们是先验的参数?那么最后我将转化次数和点击次数设置为我的Beta分布的参数吗?
在某些时候我想比较不同的广告,所以我会计算. 我如何计算该公式的每个部分?
我认为称为似然性,或 Beta 分布的“模式”。所以那是, 和和是我分布的参数。但具体和以下是仅针对广告的分布参数, 对?在这种情况下,仅仅是该广告所看到的点击次数和转化次数吗?或者是所有广告都看到了多少点击/转化?
然后我乘以先验,即 P(conversion),在我的情况下,这只是 Jeffreys 先验,它没有提供信息。之前的数据会不会和我获得更多数据一样?
我除以,这是边际可能性,所以我计算了这个广告被点击的频率?
在使用 Jeffreys 之前,我假设我从零开始并且对我的数据一无所知。该先验被称为“非信息性”。当我继续了解我的数据时,我是否会更新先前的数据?
随着点击和转化的出现,我读到我必须“更新”我的分布。这是否意味着我的分布参数发生了变化,或者先前的变化?当我获得对广告 X 的点击时,我是否会更新多个分布?不止一个之前?