掌握 NLP:阅读清单

数据挖掘 nlp 参考请求 图书
2021-10-08 14:03:30

我在网上搜索过,有数百条关于阅读内容的建议。时间在流逝,新的质量更高的技术被发布,所以我想知道 2018 年有什么相关的?

我的背景是 4 年数学与统计学士学位(顶尖大学)+ 1 年数据科学(构建预测模型,无 NLP)。

如果可能,请将其分成部分/阅读,例如

  • 背景(历史,例如哲学)

  • 理论(数学)

  • 实用(使用 Tensorflow 和其他 NLP 库构建算法)


我有一些我想做的副业:

构建一个回答多项选择题的算法

例如给出一个问题:

哪个不是水果?1) 苹果 2) 黄瓜

我想让NLP理解否定,并发现问题的主题是水果。然后我可能会合并 Google Search API 或其他东西。


将“关键字”搜索列表分类。

让我们以谷歌为例,它可能有这样的东西,它对每个关键字进行分类并给出建议。给定一个包含 10,000 个搜索的列表,我想根据相似性(不仅仅是单词的相似程度,还包括同义词)将它们分为 N 个类别。

4个回答

我建议不要尝试获取许多资源,而是先获取一个通过概念(相当稳健)的资源,然后寻找资源来完善或加深您的知识。一个来源来自斯坦福大学的 NLP 小组,是Introduction to Information Retrieval我不喜欢这本书的唯一一点是它倾向于将文档定位为列(数据科学或多或少同意它们是行),但这是一个非常微不足道的问题(只要你可以采用矩阵转置)。除此之外,这本书有很好的解释,以及适当的深度和广度,被认为是 NLP 的详尽基础。

Natural Language Processing in Action: Understanding, Analyzing, and Generate Text with Python是一本新的实用教科书,涵盖了所有最新的(2019 年)主题。

从不同来源收集

NLP 行业预计将从 2019 年的 102 亿美元增长到 2024 年的 264 亿美元。这里有一些资源可以帮助您开始使用 NLP 并成为这个非常棒的领域的一部分。

文章

19 篇关于自然语言处理 (NLP) 的精彩文章:

  1. 通过索引构建非结构化大数据

  2. 自然语言处理 (NLP) 指南

  3. 前 6 个 Python NLP 库的比较

  4. 文本分类和情感分析教程

  5. 深度学习研究回顾:自然语言处理

  6. 为文本分析新手解释的 10 个常见 NLP 术语

  7. 时间卷积网络取代 RNN 用于 NLP 预测

  8. 我如何使用 NLP (Spacy) 筛选数据科学简历

  9. 数据科学揭示特朗普推文是由两个人撰写的

  10. 自然语言处理简单介绍

  11. 一种分析 Twitter、特朗普和亵渎的 NLP 方法

  12. 一种用于数据探索的自然语言处理 (NLP) 方法

  13. 用于自然语言处理的 Python NLTK 工具列表

  14. NLP 应用程序可找到出色的可用域名

  15. 在不使用大量硬件的情况下扩展 NLP 问题

  16. 分析新闻标题的结构和有效性

  17. NLP 和文本挖掘算法的七个棘手句子

  18. 人工智能概述和 NLP 的作用

  19. 文本分类和情感分析教程

对新手而言

NLTK

  • NLP 的圣经是NLTK(自然语言工具包)。他们也有免费的电子书

图书

博客系列

YouTube视频

深度学习

博客

框架教程

慕课

斯坦福 CS224n:深度学习的自然语言处理

Python 库

Spacy - 工业级自然语言处理