有没有一种实用的策略可以学习以最优的价格为产品定价?现在我有以下任意爬山算法:
- 以起始价格运行实验
P
并收集 500 个数据点(例如 20 个购买和 480 个不购买)。 - 对什么置信水平
P
产生比P * 1.1
和更高的每位访客收入进行 t 检验P * 0.9
。然后进行 3 次加权硬币翻转,获胜者可以进行下一个实验。
这种方法有很多问题。例如,如果价格处于最优状态,则无法以更最优的定价 ex 对产品进行定价P * 1.03
。另一个是,如果在某个价格点上P = K
我们碰巧运气不好,买了 1 次 500 个数据点,算法就不会快速收敛。
如果我们获取大量数据点,问题就会变得容易,但这会减少长期收入。是否有一种快速算法可以收敛到最优价格,然后不再进行探索?