当我们从事人工智能项目时,环境(学术界、行业或竞争)是否使过程有所不同?

人工智能 人工智能设计 学术界
2021-10-25 09:41:10

当我们从事 AI 项目时,领域/背景(学术界、行业或竞争)是否使过程不同?

例如,我在比赛中看到大多数参与者甚至获胜者都使用堆叠模型,但我还没有发现业内有人实施它。交叉验证的过程怎么样,我觉得工业界和学术界还是有细微差别的。

那么,人工智能项目的背景/领域是否会使流程有所不同?如果是这样,在创建基于其领域的 AI 项目时,我需要注意哪些事项?

2个回答

我无法评论学术界的人工智能进程。我可以比较 AI 用于比赛和 AI 用于商业。为了澄清我所说的一切都是关于 ML 而不是任何其他 AI 技术。对于其他技术,该过程可能会有所不同。但我所说的大部分内容都很笼统,我认为应该仍然适用。

我在为比赛和为企业做 ML 时看到的主要区别是专注。

在为 Kaggle 比赛做这件事时,重点主要是创建模型

  • 为您指定机器学习指标
  • 给了你一些数据
  • 业务问题已交给您

为企业做这件事时有什么不同

  • 给定一个业务问题,找到可以真正从 ML 中受益的部分。您必须在其中定义 ML 问题并定义它实际上如何使业务受益。这可能涉及与业务利益相关者进行重要讨论,权衡这样做与做其他事情的利弊,向业务利益相关者传达好处,让他们对流程开始充满信心
  • 从头开始为问题找到正确的数据,确保由系统的其他部分收集或从第 3 方获取
  • 在机器学习指标之上定义业务指标。归根结底,没有人真正关心 ML 模型的召回率、准确性的好坏。重要的是相关的业务效果。
  • 制作模型、部署模型并将其与系统的其余部分集成。这很重要,因为如果您的目标只是制作模型,您将不会关心与实际使用它相关的因素,即预测延迟、运行它所需的机器成本等。
  • 模型的 A/B 测试,并行运行多个模型,能够动态调整要使用的模型

希望这可以让您对竞赛用人工智能和商业用人工智能的区别有所了解。

对比赛中的人工智能不太确定,因为我没有参加任何竞技比赛。在学术界和工业界比较人工智能,最大的区别可能是自由度。

在学术界,考虑一个研究项目左右,鼓励大量的实验和尝试新事物。新的学习受到关注,它通常涉及严格的文献调查和对以前作品的研究。即使模型表现不佳,如果可以从中吸取新的教训,也不会被视为失败。还有很多可用的数据可用于研究目的,使用或从中学习的开源项目总是受到感谢和赞赏。

在工业领域,情况完全不同。更多地关注使用预训练模型或迁移学习。很多时候,开源项目只是被克隆、温和地开发,并以公司的名义部署而不发布代码——基本上只需要在文献方面付出最少的努力。为了节省时间,更多的重点放在阅读博客文章和自述文件上(至少在我的情况下),而不是论文本身。计算效率是关键。在行业中,努力更多地集中在扩展这些模型、构建数据管道和满足客户需求上。数据也是行业关注的另一个问题,将数据收集和准备外包给第三方(通常是其他专门从事该领域的公司)是一种常见的做法)。

我想说,关键的区别在于一个人在学术界拥有的自由程度,与对工业单一目标的强烈方向感相比。工业中的人工智能几乎大部分都在解决方案和服务领域(主要是),从广义上讲,它与软件工程非常相似。

因此,总而言之,人工智能项目的领域有很大的不同,主要区别在于项目的哪个部分投入了最多的精力和重点。