什么是最流行的领域适应方法(用于迁移学习)?

机器算法验证 机器学习 分类 数据转换 领域适应
2022-04-03 13:58:56

我很好地理解监督和非监督学习,并且能够识别一些“基本”示例,例如监督分类:

  • 支持向量机
  • 随机森林
  • 逻辑回归

这些是该领域的关键作品,有大量可用的代码和出版物。

我现在开始研究监督学习中的域适应,其中已知在学习和测试时数据的分布是不同的。尽管阅读了一些文献,但我没有发现任何类似的“基本”方法一次又一次地出现。相比之下,似乎有很多完全不同的方法可以实现这一目标,其中许多方法仅在文献中出现几年。

是否有这种关键的、既定的域适应方法?目前最流行的方法是什么?

1个回答

域适应是试图改变源域以使源域分布更接近目标域分布的过程。在许多情况下,域适应方法是对传统机器学习领域的基本算法的修改,它们试图考虑训练集和测试集分布之间的差异。例如,一种流行的 DA 算法是 TrAdaboost,它是一种 Boosting 算法,是 Adaboost 算法的修改。另一个问题是 DA 方法是基于他们试图解决的两个领域之间的差异类型开发的。他们中的一些人试图接近边际分布,而另一些人则试图接近条件分布。

在我看来,它们不存在与传统机器学习相同意义上的基本或流行方法,因为 DA 方法与应用程序或它们所基于的假设密切相关。您可以了解研究这些调查的现有方法的最新技术:

潘,SJ;YANG, Q. 迁移学习调查。IEEE Transactions on Knowledge and Data Engineering, v. 22, n. 10 页。1345–1359,出。2010 年。

Weiss, K., Khoshgoftaar, TM & Wang:迁移学习调查。D. J 大数据,2016。