我想在编程语言源代码(比如说 Python)语料库上执行机器学习任务(例如监督分类、聚类),并且我正在寻找用于从 Python 文档中解析和构造结构的工具(例如) 代码,在概念上类似于 NLP 标记化和更高级别的语言处理,针对编程语言进行了调整。
虽然我能够找到很多与 NLP 相关的通用材料,但在我看来,更好的起点是以前专门针对编程语言的研究。
我正在寻找要搜索的工具、资源、学术文章和关键字,基本上任何帮助都将不胜感激!
我想在编程语言源代码(比如说 Python)语料库上执行机器学习任务(例如监督分类、聚类),并且我正在寻找用于从 Python 文档中解析和构造结构的工具(例如) 代码,在概念上类似于 NLP 标记化和更高级别的语言处理,针对编程语言进行了调整。
虽然我能够找到很多与 NLP 相关的通用材料,但在我看来,更好的起点是以前专门针对编程语言的研究。
我正在寻找要搜索的工具、资源、学术文章和关键字,基本上任何帮助都将不胜感激!