是什么让你对自己的结果充满信心?你认为在什么时候你可以向不懂技术的上级展示你的工作?

数据挖掘 表现 准确性
2021-10-04 15:19:35

我知道模型与您获得的数据一样好,而糟糕的设计会产生非常糟糕的数据。非随机抽样、不平衡/不完整的设计、混杂会使数据分析变得非常困难。

在什么时候应该确信他们运行了一个有用的模型?您是否只是对训练/测试数据集进行交叉验证并收工?显然“所有模型都是错误的,有些是有用的”,但在某些时候,通过 LASSOing 排除太多参数和通过降低 BIC 进行奇怪转换的权衡变得明显。

tl;博士在一天结束时是什么让你走“我为我的公司/项目做了正确的事情,这应该有效”

2个回答

嘿欢迎来到本站!

你说的是对的,数据科学还没有达到它有一些标准方法来实现这一点的阶段(标准程序,不知道我们能否在不久的将来达到那个阶段)。但我们有一些通用标准,例如:

  1. 预测:ETS、ARIMA、SARIMA 等
  2. 预测:线性回归、随机森林、GLM、神经网络等
  3. 分类:逻辑回归、随机森林等

当您进入粒度级别时,很难一概而论,因为每个业务问题都是不同的,并且无法使用一种方法来解决所有业务问题。

所以,为了回答下一个问题,你如何确信结果足够好,我假设你已经听说过 RMSE、MAPE 以及更多关于分类问题的预测和混淆矩阵的知识。我们使用这些指标来查看访问模型的性能,例如,如果您尝试对给定细胞是否为癌细胞进行分类,则有 100 条记录,其中 90 条是非癌细胞,10 条是癌细胞,您的模型给出99% 的准确率,但可以将 9 个中的 5 个分类,实际上是总数的 55%,在这种情况下,您需要查看不能使用准确度,您需要使用 F1 分数等。当您询问模型时,所有模型都没有用。的确,并非所有构建的模型都将用于生产级别,您会选择最好的模型并将其生产化。你可以重新训练你的模型(每天,每周,每月根据业务需求)。您会在验证完成后将其称为休息日吗?我不会,我会去主题专家那里向他展示结果,询问他/她的见解,如果他们都是内联的,那么我将对一些实际数据进行 Beta 测试,然后将其生产。

现在解决您的最后一个问题,没有标准说这是好是坏,如果它对您有用,那么您的业务就是一个好模型。为了方便您的经理和主题(数据)专家,您需要深入挖掘数据,尝试所有不同的场景,尽可能多地提出问题。试着很好地理解数据。因此,您可以用数据支持的答案来回答业务问题(这只有在您对数据更差时才有可能)。由于他们非常擅长业务,因此他们会提出有关业务的问题,因此您需要通过充分了解业务和数据来为所有此类场景做好准备。

最后,我确实有和你一样的感觉。我做了很多事情,但没有任何效果,但你不应该不高兴,因为你知道这些会导致你不成功的结果(最好的例子是托马斯阿尔瓦爱迪生在使用钨制作灯泡之前使用了 1000 种不同的金属) . 同样,我们尝试过的所有方法都是您尝试获得解决方案的不同步骤。我的基础是,我是否每天都尝试不同/新的东西。这个过程的关键部分是,在每一步都维护清晰的文档。这将在不久的将来派上用场。

研发中的任何事情都不会浪费,它只是另一种尝试或实验,因此您的工作永远不会浪费。您正在努力为贵公司的光明未来打下坚实的基础。

是什么让你对自己的结果充满信心?

评估您是否对真实信号或噪声建模的适当方法完全取决于您提出的问题以及您用来解决问题的建模方法。关于这个主题已经写了很多非常厚的书,通常将他们的注意力限制在一个问题域和/或模型类型上。与模型评估相关的复杂性是数据科学家通常拥有研究生学位的重要组成部分。这将我们带到您问题的第二部分:

你认为在什么时候你可以向不懂技术的上级展示你的工作?

你的技术文盲上司没有那种可以告诉他们如何评估你的分析的研究生学位。他们信任您提供诚实和准确的结果。很容易误导那些不熟悉统计数据的人相信你想要呈现的任何叙述。您有责任确保您的结果是无懈可击的,或者至少与您客户的风险承受能力同步。

当您对正确解释结果感到满意时,您的结果就可以分享了,并且您已经制定了如何清楚地传达它们的计划。

归根结底,是什么让你走“我为我的公司/项目做了正确的事,这应该行得通”

  1. 我已经建立了一个模型来实现我的目标。
  2. 我很满意我的建模方法是合理且可重复的。如果我正在处理预测任务,我还想确保我的模型能够很好地推广到样本外数据。
  3. 我已经评估了使用我的模型的预期影响,并且有理由相信应用它的好处证明我在构建它时所花费的时间和精力是合理的。
  4. 我有一条明确的实施途径。我有一个使我的结果可行的技术计划,并且知道我需要谁的支持来实现它。
  5. 我相信我可以通过一种方式传达我的结果,让非技术利益相关者相信我的结果是真实的,并减轻他们的担忧。