数据挖掘 - 您如何克服客户以结果为导向的思维方式？ - 吾爱随笔录

您如何克服客户以结果为导向的思维方式？

数据挖掘预测建模

2021-10-03 02:17:27

我正在与一个客户合作一个特殊的项目，我将在这个问题中混淆。基本上，我试图克服客户的一些短期的、以结果为导向的想法。

假设您有一个模型来预测赛马的表现。您的模型告诉您的客户出售赛马 X，因为它的性能概率很低 (<10%)。这匹马被卖掉了，并说赛马继续赢得 3 场比赛。您的客户说：“看，我们不应该放过那匹赛马！模型错了！”

作为数据科学家，我们可以理解异常情况会发生，而且这匹马可能也输掉了一些比赛——这次我们只是站在了概率的错误一边。但是您如何克服客户的这些反对意见？您如何将短期思维转变为预测建模的长期前景？

2个回答

你用一匹马描述的场景基本上是轶事证据。为了客观地评估您正在做的事情，您需要与客户达成一致才能进行此实验。

我知道你不相信我的马预测，这是完全可以理解的。担心那些逃脱的人是人类的天性。让我们客观地处理这个问题并进行实验。我会给你 50 匹马的买入/卖出评级。然后我们跟踪他们六个月的表现。如果平均而言我的评级优于抛硬币，我们就会知道我们在宏观层面上有所作为，即使有一些人逃脱了。如果我的模型最终比抛硬币还差，我们就会知道模型需要改进，否则你需要解雇我。

我认为你应该管理客户的期望。

首先，尝试定义和使用通用术语。您谈到表现的可能性很低，而您的客户谈到赢得比赛。你能把这些条款联系在一起吗？例如，如果表现的概率是赢得一场比赛的概率，一旦你有了一个通用的术语，你就可以向客户解释一个表现不佳的人在不为零的情况下赢得 3 场比赛的概率并且给定 X 匹马，你是期待看到 Y 这样的马，即使模型是完美的。

应讨论短期与长期问题并将其纳入您想要预测的概念中。我对赛马不熟悉，但我认为有些马是短跑选手，可以赢得一场比赛，而有些马耐力更强，可以赢得整场比赛。如果存在这样的兴趣差异，他们应该指导整个研究过程。

接下来，您应该向客户解释模型错误，并不意味着它没有用。确实，我在Box的想法中

“本质上，所有模型都是错误的，但有些是有用的”

您可以通过将您的模型与一些基准模型进行比较来帮助客户看到好处（例如，假设所有的马都是快/慢的、简单的近似值、公共领域知识估计等）。

既然我们明白完美的预测并不是受益的必要条件，那就给您的客户额外的权力。告诉您的客户您的模型会出现错误，但他可以选择错误会落在哪一边。他可以通过为误报和误报分配成本来做到这一点。给定成本，您可以调整模型以更好地满足他的需求（例如，通过选择优化成本的置信水平）。

一旦你有了模型，计算混淆矩阵并与客户讨论。向他解释准确率和召回率及其含义（例如，模型将推荐销售 x% 确实是好马的马）。

最后但并非最不重要的一点是，如果这是一个正在进行的项目，您应该使用错误作为改进的来源。改进方法的细节取决于具体的项目。但是，至少回顾一下这些案例并尝试理解为什么你的模型在它们上失败了。

祝你好运！

其它你可能感兴趣的问题

上一篇提高 R 中不平衡数据集的分类器性能下一篇神经网络的模型参数和超参数及其在训练和验证阶段的调整