有哪些不错的算法/技术可用于优化和预测点击率 (CTR)?

数据挖掘 r Python 优化
2021-10-12 23:01:32

点击率的定义:

CTR 是您的广告获得的点击次数除以您的广告展示次数的百分比(点击次数 ÷ 展示次数 = CTR)。

4个回答

逻辑回归非常常见且有效。

这将为您提供给定展示的点击概率。您可能需要更多信息来进行优化,例如关键字或 A/B 测试。

有一组称为Bandit 算法的算法(或技术) ,专门处理问题陈述,即广告点击率的优化。

这个问题是在一个拥有自动售货机的多个强盗的环境中形成的。有多种策略可以实施:

  • Epsilon 贪婪策略
  • Epsilon 优先策略
  • Epsilon 递减策略
  • 上下文 Epsilon 策略

关于为什么 Bandit 算法优于 A/B 测试框架的参考。

我尝试了以下算法:

  1. Steffen Rendle 的Factorization Machines - 用于稀疏特征集的非常好的算法,用于构造多项式回归. 测量特征之间的交互。模型除了学习特征的线性权重外,还为每个特征学习一个向量空间,以学习这个新空间中特征之间的配对交互。

  2. Field-Aware Factorization Machines - FM 模型的改进。最近,已被用于赢得两次 Kaggle 的点击率预测比赛。

  3. FTRL - “Follow The (Proximally) Regularized Leader”算法- 正则化在线逻辑回归。等效于不使用正则化时的在线(随机)梯度下降。很容易实现。

  4. Microsoft 的AdPredictor算法 该算法基于将离散或实值输入特征映射到概率的概率回归模型。它保持模型权重的高斯信念,并执行从近似消息传递派生的高斯在线更新。

你可以在关于 CTR 的 kaggle 比赛中看到很好的算法:

只需去每个比赛的论坛并寻找获胜的解决方案;)