使用神经网络进行机器学习的这两种分类法之间有什么关系?

人工智能 神经网络 机器学习 强化学习 比较 无监督学习
2021-10-21 00:44:29

能否请您告诉我以下神经网络学习算法的分类哪个是正确的?

一个将其分类为:

  • 监督,
  • 无人监督和
  • 强化学习。

但是,第二在第 34 页提供了不同的分类:

  • 与老师一起学习(纠错学习,包括增量和批量训练),
  • 没有老师的学习(强化、竞争和无监督学习)
  • 基于记忆的学习,和
  • 玻尔兹曼学习。
1个回答

能否请您告诉我以下神经网络学习算法的分类哪个是正确的?

  1. 第一个将其分类为:
    • 监督,
    • 无人监督和
    • 强化学习。

这三种机器学习形式并不是神经网络学习算法(或者,实际上是任何学习算法)的真正不同形式;它们是不同形式的学习问题它们基本上描述了我们在学习过程中向学习算法提供了多少信息/我们提供了什么样的信息,无论我们使用什么算法来学习

  • 在监督学习中,我们提供了非常详细的信息;我们给出了输入 + 所需输出的示例对。
  • 在无监督学习中,我们仍然给出了许多示例输入,但没有给出任何期望的输出。例如,这可能是因为我们根本不知道自己想要的输出是什么。无监督学习最常见的例子是学习创建集群。我们通常会给出实例之间的相似性或距离的某种度量,并要求学习算法为我们创建实例集群,以便同一集群内的实例彼此“接近”,而不同集群中的实例远离彼此。这与监督学习不同,因为我们不直接告诉学习算法每个示例实例属于哪个集群。
  • 在强化学习中,我们通常尝试在代理可以采取行动的环境中了解策略(~= 行为)。我们通常不完全知道最好的完整策略是什么,但偶尔会以数字奖励的形式给出“提示”(强化)。这不是完全有监督的学习,因为我们没有确切地知道一个状态下的最佳动作是什么。如果它是一个好孩子,你可以把它想象成给狗一块饼干。

现在,确实也有监督学习/无监督学习/强化学习算法,但它通常首先是问题的属性;一旦你知道你要解决什么类型的问题,你就会寻找可以处理该问题的匹配算法。

  1. 但是,第二个在第 34 页提供了不同的分类:

    • 与老师一起学习(纠错学习,包括增量和批量训练),
    • 没有老师的学习(强化、竞争和无监督 - 基于记忆的学习,以及
    • 玻尔兹曼学习。

老实说,这对我来说似乎有点过分了。有老师的学习与没有老师的学习可以被视为上面的监督学习与无监督学习。我想强化学习会介于两者之间。

他们所说的基于记忆的学习通常也被称为基于实例的学习。这突然不再是关于学习问题的性质了,这是一种学习算法我根本不知道基于实例的学习在神经网络中很常见,实际上您的链接中给出的示例(最常见的示例)是k-最近邻算法,它与神经网络没有任何关系. 这通常用于监督学习问题。

玻尔兹曼学习是针对特定类型神经网络(具有特定架构)的一种特殊学习算法,通常与无监督学习(或“生成”学习,学习给定输入数据的概率分布)相关。