我正在寻找涵盖(至少)以下内容的学术(即带有数学公式)教科书:
- GAN
- LSTM 和转换器(例如 seq2seq)
- 注意力机制
我得到的最接近的匹配是深度学习(2016 年,麻省理工学院出版社),但它只涉及上述主题的一部分。
我正在寻找涵盖(至少)以下内容的学术(即带有数学公式)教科书:
我得到的最接近的匹配是深度学习(2016 年,麻省理工学院出版社),但它只涉及上述主题的一部分。
还有几本书是2016年后出版的,涵盖了你感兴趣的一些话题。我没有读过,所以我真的不知道它们是否好,但我试着总结一下如果它们涵盖了您可能感兴趣的一些主题。
Deep Learning with Python (2017),Francois Chollet(最初的 Keras 库的作者),在第 8.5 节(第 305 页)中涵盖了 GAN,但它似乎没有涵盖转换器和注意力机制,尽管它涵盖了其他中间/高级主题(不确定程度如何),例如使用 LSTM 生成文本、DeepDream、神经风格迁移和 VAE
Grokking deep learning (2019),作者 Andrew Trask,似乎涵盖了一些中级/高级主题(例如 LSTM 和相关任务),但没有转换器或 GAN(除非我错过了它们);你可以在这里找到随附的代码
Generative Deep Learning: Teaching Machines to Paint, Write, Compose, and Play,作者 David Foster,涵盖了 GAN、VAE 和其他东西的许多变体
第一个变形金刚于 2017 年出版,所以我想可能还没有一本书广泛涵盖它和其他相关模型,例如 GPT 模型(如果你对 CV 感兴趣,请查看这篇博文,虽然它似乎列出主要涵盖传统 CV 技术的书籍)。注意机制较旧,可能可以在涵盖机器翻译主题的教科书中找到(例如带有 LSTM 的 seq2seq 模型),例如这个。
我推荐Eugene Charniak ISBN 978-0-262-03951-2 (MIT 2018)的深度学习简介。它提到GAN& LSTM& Attention(所有三个都出现在索引中)。
但也请阅读 Pitrat 的最后一本书:人工生物:有意识机器的良心——它确实涵盖了机器学习(但不是“深度学习”意义上的),但在 2016 年之前出版。