用数据统计判断新产品是否蚕食旧产品

数据挖掘 机器学习 Python 预测建模 统计数据
2021-09-16 09:26:36

假使,假设 A 是一家出租车公司,通过其标准账户提供在线出租车预订服务。

最近,该公司推出了预付费高级账户,具有打折、特价、保证接送和低等待时间等功能。

一项向公众进行的调查显示,对新保费账户的反应令人鼓舞。

问题:令人鼓舞的反应是来自新客户还是现有客户?

我们得到的数据包括时间(预订)、接送地点、旅程费用、乘车类型(高级或标准)、客户人口统计和定价信息。

我完全迷失在这里。我们能做些什么来回答上面的问题?任何提示表示赞赏。


如果我被要求确定客户是否有任何固定的运输预算,我该如何使用上面的数据来解决它?

我的计划是将支出分成每月销售额,然后计算他们的平均值。假设我们有12样本均值和样本方差。由于样本方差可能不相等,因此我采用 Welch ANOVA 检验。这足够了吗?

2个回答

如果给定服务的行程是新客户还是老客户,没有直接回答问题的数据。如果有新的增长或只是服务切换,您需要有一个客户 ID 才能正确归因。

您运行的任何统计数据最多只能显示新服务与增加的收入之间的相关性。不可能有因果关系。例如,这些变化可能是由于季节差异或与新服务无关的其他因素造成的。

您可以尝试进行某种形式的假设检验。

  • 零假设:标准产品一天的平均销售额=μ.
  • 备择假设:标准产品一天的平均销售额μ

然后,您可以提取出行类型为标准的行并将其拆分为 2 个时间段 - 在引入高级服务之前和之后。然后,您可以按天或周(您在时间范围内的选择)汇总您的销售额,然后使用上述假设和选定的显着性水平进行 Z/T 检验。