似乎有很多子领域,所以我有兴趣更好地理解这些方法。
我正在寻找有关每个答案的单个框架的信息,以允许粒度而不会使整体答案变得太长。例如; 深度学习神经网络将是一个单一的答案。
似乎有很多子领域,所以我有兴趣更好地理解这些方法。
我正在寻找有关每个答案的单个框架的信息,以允许粒度而不会使整体答案变得太长。例如; 深度学习神经网络将是一个单一的答案。
斜体字应该为您提供足够的googleable术语来开始更深入的研究:P。
统计机器学习有 3 个主要分支。
监督学习 当一个问题可以表述为将一些和一些. 例如,对一张猫的图片进行分类() 带有标签“猫”()。监督学习中的训练通常意味着展示一些,让代理预测标签,将预测与答案进行比较以获得错误度量,最后使用错误来更新代理以对未来做出更好的预测s。MNIST是分类域的一个很好的例子。
1.1 当我们想要学习相关的数字而不是标签时,监督学习也适用于回归,例如考虑到多年吸烟和体重的心脏病风险。
无监督学习 当我们想从没有标记响应的数据集中得出推论时,使用这种类型的学习。它可用于查找数据中的隐藏模式或分组。
强化 学习沙监督学习中的 s 是iid,这意味着它们与前面的无关模型之前观察到的。但是,最近有很多问题,有时(),对于弄清楚什么是非常重要的预测() 下一个()。强化学习 (RL) 领域建立在这一概念之上,通过将观察构建为由代理与环境交互生成的数据。具体来说,RL 领域提出了寻找行为(策略)来选择动作的问题,以便使用该策略的代理可以最大化称为环境奖励的特殊信号。代理从世界状态开始() 时并采取一些行动() 将其置于新状态 () 并给予奖励 ()。
神经网络是一种在数据中寻找特征(某种显着差异)的技术。它们可以用于上述所有学习策略,但对它们来说不是必需的,尽管它们的应用最近取得了一些非常强大的结果。深度___学习只是将多层神经网络应用于上述学习方法之一。