自学和迁移学习有什么关系?

人工智能 比较 术语 文件 无监督学习 迁移学习
2021-10-18 13:00:44

我是迁移学习的新手,我从阅读迁移学习调查开始,它说明了以下内容:

根据源域中标记和未标记数据的不同情况,我们可以进一步将归纳迁移学习设置分为两种情况:

案件(a)(这与我的问题无关)。

案件(b):源域中没有可用的标记数据。在这种情况下,归纳迁移学习设置类似于自学学习设置,这是由 Raina 等人首先提出的。[22]。在自学学习设置中,源域和目标域之间的标签空间可能不同,这意味着不能直接使用源域的边信息。因此,它类似于归纳迁移学习设置,其中源域中的标记数据不可用。

由此,我明白自学就是归纳迁移学习。

但是我打开了上面提到的self-taught learning的论文(即Raina等人的论文[22]。),它在引言中陈述了以下内容:

由于自学学习对未标记数据类型的限制明显较少,因此在许多实际应用中(例如图像、音频或文本分类),它比典型的半监督学习或迁移学习方法更容易应用。

在这里,迁移学习看起来与自学学习不同。

那么它们之间的正确关系是什么?

1个回答

经过大量搜索,我认为 self-taught learning 是一个迁移学习的范畴,我认为当 Self-taught learning 论文发表时(2007),没有任何关于迁移学习的很好的调查,从高引用可见Pan 的论文,他的论文(发表于 2009 年)以一种在迁移学习之前不存在的清晰方式描述了迁移学习。

此外,将自学学习视为迁移学习类别是合理的,因为他实际上将从未标记数据中学到的知识转移到我们想要执行的监督任务中(不需要未标记数据(用于训练)遵循与将用于监督任务的标记数据相同的类别标签或生成分布)。

如果有人发现我的答案有问题或缺少某些内容,请告诉我。