当我们从事 AI 项目时,领域/背景(学术界、行业或竞争)是否使过程不同?
例如,我在比赛中看到大多数参与者甚至获胜者都使用堆叠模型,但我还没有发现业内有人实施它。交叉验证的过程怎么样,我觉得工业界和学术界还是有细微差别的。
那么,人工智能项目的背景/领域是否会使流程有所不同?如果是这样,在创建基于其领域的 AI 项目时,我需要注意哪些事项?
当我们从事 AI 项目时,领域/背景(学术界、行业或竞争)是否使过程不同?
例如,我在比赛中看到大多数参与者甚至获胜者都使用堆叠模型,但我还没有发现业内有人实施它。交叉验证的过程怎么样,我觉得工业界和学术界还是有细微差别的。
那么,人工智能项目的背景/领域是否会使流程有所不同?如果是这样,在创建基于其领域的 AI 项目时,我需要注意哪些事项?
我无法评论学术界的人工智能进程。我可以比较 AI 用于比赛和 AI 用于商业。为了澄清我所说的一切都是关于 ML 而不是任何其他 AI 技术。对于其他技术,该过程可能会有所不同。但我所说的大部分内容都很笼统,我认为应该仍然适用。
我在为比赛和为企业做 ML 时看到的主要区别是专注。
在为 Kaggle 比赛做这件事时,重点主要是创建模型
为企业做这件事时有什么不同
希望这可以让您对竞赛用人工智能和商业用人工智能的区别有所了解。
对比赛中的人工智能不太确定,因为我没有参加任何竞技比赛。在学术界和工业界比较人工智能,最大的区别可能是自由度。
在学术界,考虑一个研究项目左右,鼓励大量的实验和尝试新事物。新的学习受到关注,它通常涉及严格的文献调查和对以前作品的研究。即使模型表现不佳,如果可以从中吸取新的教训,也不会被视为失败。还有很多可用的数据可用于研究目的,使用或从中学习的开源项目总是受到感谢和赞赏。
在工业领域,情况完全不同。更多地关注使用预训练模型或迁移学习。很多时候,开源项目只是被克隆、温和地开发,并以公司的名义部署而不发布代码——基本上只需要在文献方面付出最少的努力。为了节省时间,更多的重点放在阅读博客文章和自述文件上(至少在我的情况下),而不是论文本身。计算效率是关键。在行业中,努力更多地集中在扩展这些模型、构建数据管道和满足客户需求上。数据也是行业关注的另一个问题,将数据收集和准备外包给第三方(通常是其他专门从事该领域的公司)是一种常见的做法)。
我想说,关键的区别在于一个人在学术界拥有的自由程度,与对工业单一目标的强烈方向感相比。工业中的人工智能几乎大部分都在解决方案和服务领域(主要是),从广义上讲,它与软件工程非常相似。
因此,总而言之,人工智能项目的领域有很大的不同,主要区别在于项目的哪个部分投入了最多的精力和重点。