我可以使用多元线性回归的推论做出经济决策(例如,利润最大化)吗?

机器算法验证 自习 多重回归 推理 因果关系 推荐系统
2022-04-14 00:48:09

我有一个问题似乎不属于经典的“推荐系统”,但可能属于因果推理的范畴(虽然我不确定)。

假设我有不同地理区域特定产品的销售数据集。换句话说,我的数据集中的每个示例都有一个该地理区域的销售响应变量,以及该区域的多个预测变量、商店数、销售代表数、广告预算等。

然后我在数据集上运行多元线性回归以获得每个预测变量的系数,也许我发现最大的系数属于# of sales reps变量。

现在,如果我查看数据集中销售量较低的一个特定示例(区域),是否适合使用多元线性回归的结果来提供增加该区域销售代表数量以增加销售额的建议?

我可以想象这有危险,但它们到底是什么?这个问题是否属于推荐系统或因果推理,或两者兼而有之?我应该学习哪些主题才能更好地理解这样的场景?

3个回答

这是回归模型没有完全回答的成本收益问题(或等效的利润优化问题)。这类问题需要您将您对产品销售的统计推断与经济分析相结合。通常,这需要将公司的利润函数写为销售代表数量的函数,包括销售额和雇用这些代表的可变成本。您使用回归模型来估计公司的“销售函数”,然后得到公司“利润函数”的估计值。然后,您可以通过考虑您将获得的估计销售数量和雇用他们的已知可变成本(例如,工资等)来估计销售代表的最佳数量。

这里的第二个问题是您是否可以因果解释您的回归结果,例如,如果公司改变销售代表的数量,他们将因此改变产品销售的数量。使用被动观察,您的回归输出不太可能代表纯粹的因果效应,因此您可能需要稍后做一些进一步的工作来处理这个问题。这很复杂,所以我将把它作为一个警告,在下面的分析中,我将假设您可以以因果方式解释您的回归输出。


建立利润优化问题:r表示公司雇用的销售代表的数量,让c表示雇用额外销售代表的“可变成本”(例如,工资成本等)。此外,让P是公司销售的产品集合,令πi是每个产品销售该产品的单个项目的利润(即该项目的收入减去获得该项目的可变成本)iP. S(i,r)是产品的销售数量i当公司有r销售代表(注意这部分是随机的——因此是大写的)。那么企业的利润函数为:

π(r)=iPπiS(i,r)rcOther Fixed Costs.

在企业投入因素优化的计量经济学分析中,我们通常希望最大化预期利润 E(π(r))(假设股东在边际上是风险中性的)。您的回归模型为您提供了随机部分的模型S,它可以让你估计这部分,给你一些估计量S^为预期的销售额。假设您可以估计所有产品,那么您就有一个预期利润的估计量,即:

π^(r)=iPπiS^(i,r)rcOther Fixed Costs.

估计的最佳销售代表人数为:

r^=arg maxrN π^(r).

假设某些基本属性确保收入函数的平滑性和准凹性,销售代表的最佳(实际)数量将出现在额外销售代表的边际收入等于边际成本的“临界点”(即工资等)---即,我们有:

Marginal revenue(r^)iPπiS^r(i,r^)=c=Marginal Cost.

这是企业行为经济学的标准结果——在一些基本规律条件下,利润最大化企业将使用生产要素,直到其边际收入等于边际成本(称为利润最大化规则)。(您可能需要稍微改变一下,因为销售代表的数量必须是非负整数,因此最优值将出现在上述方程的精确解附近。)

这为您提供了如何提出此类经济优化问题的简单概述。正如你所看到的,这里的答案不仅受到回归模型推论的影响,还受到雇佣销售代表的可变成本的影响。如果就业的工资成本增加,在其他条件不变的情况下,我们预计销售代表的最佳数量会减少,反之亦然

我相信您在这里要问的是线性回归系数是否可以因果解释,即是否可以使用它们来计算(假设的)干预的影响,您可以通过值 X 更改某些预测变量,并使用回归计算销售额等的增加。

该问题的基本答案是(除了寻找正确模型等通常的警告之外):是的,如果您坚持有关变量选择的某些规则,即如果您避免在回归中使用碰撞器,也许您还应该考虑调解员。

有关详细说明,请参阅 Lederer, DJ, Bell, SC, Branson, RD, Chalmers, JD, Marshall, R., Maslove, DM, ... & Stewart, PW (2019) Control of confounding and reporting of results in causal inference study . 来自呼吸、睡眠和重症监护期刊编辑的作者指南。美国胸科学会年鉴,16(1),22-28。

我同意这种观点,并且还可以想象,假设应用于不同地区的一些变量回归模型的相同功能完全适合作为增加销售代表数量的决定的基础,那么存在危险。

有一次实际处于销售职位后,必须了解至少有两个部分来完成销售,一个好的销售代表和一个真正有能力购买产品的买家。最后一句话的含义是,在一个可能正在经历经济衰退的地区,而该国其他地区正在显示增长,就国家模式而言可能是一个异常值。由于基本经济变量不是模型的一部分,模型的销售区域差异可能是疏忽的。

因此,即使概括的国家回归关系似乎意味着可以通过简单地增加销售人员来提高总销售额,但如果所有其他条件不相等,即该地区人们实际购买的经济能力,情况可能并非如此。

了解实际预测模型的潜在局限性至关重要。