在 RI 有data
哪里head(data)
给出
day new_users promotion
1 33 20.8
2 23 17.1
3 19 1.6
4 37 20.8
现在day
只是这一天(并且是有序的)。promotion
是当天的促销价值——它只是电视广告的成本。new_users
是我们当天获得的新用户数量。
在 RI 中绘制数据plot(data$promotion, data$new_users, col="darkgreen"
),我们得到
该图表明我们有一个正相关,即更多的推广我们获得更多的新用户。在正相关的 RI 测试中:
cor.test(data$promotion, data$new_users, method="kendall", alternative="greater")
这给了我们一个非常低的 p 值,即我们有正相关。
寻找甜蜜点
我想找到一个甜蜜点,即增加promotion
不影响(或不增加)的点new_users
。
# Setting the promotion-value to 24
promotion_rate = 24
# Sub setting data so we only have promotion-value higher than 24
data_new = subset(data, data$promotion > 24)
# Testing for positive correlation
cor.test(data_new$promotion, data_new$new_users, method="kendall", alternative="greater" )
我已经为promotion_rate
. 结果是对于低于 24 的所有提升值,我们得到一个低 p 值,即在这些情况下我们具有正相关。对于高于 24 的提升值,我们得到一个高于 0.05 的 p 值,即在这些情况下我们没有正相关。
现在可以得出结论说 24 是最佳位置吗?
更新
我现在已经绘制了new_users
RI 类型的 -的累积总和
plot(cumsum(data$new_users), xlab="days", ylab="cumulative sum of new_users", col="darkred")
类似地,我绘制了promotion
. 蓝色是new_users
,橙色是promotion
。
plot(cumsum(data$new_users),xlab="days",col="blue")
points(cumsum(data$promotion), col="darkorange")
但这看起来像一条直线,所以甚至有可能找到一个甜蜜点吗?