什么是“计算语言学”?

人工智能 机器学习 自然语言处理 术语
2021-11-08 09:03:41

我不清楚以改进 NLP 系统为目标的人是否可以被称为“计算语言学家”,即使她/他没有直接通过编码修改算法。

让我们考虑以下活动:

机器学习注释:形态学分析、句法分析、词性标注注释、实体(NER)和搭配的分析和注释;支持内容分类;分块;词义消歧。记录注释工具的技术问题以提高其可靠性。记录开发 NLP 算法的研究团队采用的语言和逻辑特定规则,以提高注释和先前用于训练 NLP 的标准之间的一致性。

这些活动可能被认为是“计算语言学”吗?如果不是,那是他们的专业类别,他们应该如何以一个综合它们的词包含在简历中?

2个回答

是的。计算语言学家是(除其他外)使用计算机处理/建模/分析/...自然语言的人。编码可能是其中的一个方面,但最不重要的是:您总是可以让非语言程序员为您编码。

我在大学学习“计算语言学”,虽然编程是课程的一部分,但编码只是实际主题的一个次要方面。高级教授(和系主任)自己无法进行任何编码;他来自语言学方面。

能够编程很有用,因为它可以加快速度并使您更加独立,但这绝不是成为计算语言学家的重要组成部分。

更新:我被指控歪曲了 CL 领域。然而,它是一个广泛的跨学科领域,包含许多要素。当然,在学术/研究方面,您可能会比在应用/商业方面进行更多的编程,但我认为您可以轻松地作为计算语言学家工作,而无需实际进行任何编程。对于大多数任务,现在都存在现成的软件,因此您实际上不需要编写任何新的程序。

(披露:我是计算语言学的博士生和讲师)

确实,无需修改即可使用现有工具进行注释和调试工作可以视为计算语言学。

然而,大多数计算语言学家每天都在编程,因为他们积极开发工具。只是为了给您一些背景信息,在 ACL 或 EMNLP(最大的会议)等主要计算语言学会议上,大多数作者自己编写了代码。

说编码是作为计算语言学家的一个不重要的方面,正如接受的答案所声称的那样,是一种轻微的歪曲。