我熟悉有监督和无监督学习。我参加了 Andrew Ng 在 Coursera.org 上完成的 SaaS 课程。
我正在为强化学习寻找类似的东西。
你能推荐一些东西吗?
我熟悉有监督和无监督学习。我参加了 Andrew Ng 在 Coursera.org 上完成的 SaaS 课程。
我正在为强化学习寻找类似的东西。
你能推荐一些东西吗?
对于这里的好答案,我会补充
RL 的简要概述:一个地方最重要的概念。
另一个简短的概述,以演示文稿的形式。
Ben Recht 的RL 的局外人之旅非常全面且易于理解。
贝尔曼方程:整个强化学习理论的核心。
Andrej Karpathy解释的策略梯度(在其他答案中被称为“pong from pixel”,这是链接)。
这些几乎没有触及 RL 的表面,但它们应该可以帮助您入门。
有一个 Youtube 播放列表(在DeepMind 频道中),其标题是强化学习简介,这是David Silver的强化学习课程(共 10 节课) 。
一位关注并完成课程的人写道(作为 Youtube 评论):
优秀的课程。节奏很好,有足够多的例子来提供良好的直觉,并且由在将 RL 应用于游戏方面处于领先地位的人教授。
在此之前问问自己是否真的想了解“强化学习”。尽管有很多关于强化学习的炒作,但强化学习在现实世界中的适用性几乎不存在。大多数在线课程只教你一点关于机器学习的知识,所以最好彻底掌握它,而不是继续进行强化学习。学习强化学习与学习无监督/监督学习技术有些不同。
话虽如此,掌握强化学习的最快方法如下:
要了解这些技术背后的数学原理,请参阅Sutton 和 Barto 的强化学习:简介。
阅读相关论文(游戏等)。
PS:确保你对神经网络的基础知识有透彻的了解,因为目前大多数 RL 论文都涉及以某种或其他方式使用 DNN 作为逼近器。
我最近在 edx 上看到了微软的一门课程。它被称为“强化学习解释”。
这是链接: https ://www.edx.org/course/reinforcement-learning-explained-0 这不是很全面,但至少提供了一个很好的起点。