最近的深度学习教科书(即至少涵盖 GAN、LSTM 和转换器以及注意力)

人工智能 深度学习 参考请求 生成对抗网络 变压器 注意力
2021-11-12 16:32:03

我正在寻找涵盖(至少)以下内容的学术(即带有数学公式)教科书:

  • GAN
  • LSTM 和转换器(例如 seq2seq)
  • 注意力机制

我得到的最接近的匹配是深度学习(2016 年,麻省理工学院出版社),但它只涉及上述主题的一部分。

2个回答

还有几本书是2016年后出版的,涵盖了你感兴趣的一些话题。我没有读过,所以我真的不知道它们是否好,但我试着总结一下如果它们涵盖了您可能感兴趣的一些主题。

一个变形金刚于 2017 年出版,所以我想可能还没有一本书广泛涵盖它和其他相关模型,例如 GPT 模型(如果你对 CV 感兴趣,请查看这篇博文,虽然它似乎列出主要涵盖传统 CV 技术的书籍)。注意机制较旧,可能可以在涵盖机器翻译主题的教科书中找到(例如带有 LSTM 的 seq2seq 模型),例如这个

我推荐Eugene Charniak ISBN 978-0-262-03951-2 (MIT 2018)的深度学习简介。它提到GAN& LSTM& Attention(所有三个都出现在索引中)。

但也请阅读 Pitrat 的最后一本书:人工生物:有意识机器的良心——它确实涵盖了机器学习(但不是“深度学习”意义上的),但在 2016 年之前出版。

另请参阅RefPerSys如果你说法语,也可以看看这个和更普遍的AFIA组织。