合成任务和采样任务的根本区别是什么?

人工智能 机器学习 术语 生成模型
2021-11-04 05:57:16

在机器学习的任务列表中,合成和采样是关键任务之一。考虑以下关于 第 5 章中的合成和采样任务的解释:机器学习基础,来自深度学习一书(作者 Aaron Courville 等人)

在这类任务中,机器学习算法被要求生成与训练数据中相似的新示例当手动生成大量内容成本高昂、乏味或需要太多时间时,通过机器学习进行合成和采样对媒体应用很有用。例如,视频游戏可以为大型物体或风景自动生成纹理,而不需要艺术家手动标记每个像素(Luo et al., 2013)。在某些情况下,我们希望采样或合成过程在给定输入的情况下生成特定类型的输出。例如,在语音合成任务中,我们提供一个书面句子并要求程序发出包含该句子口语版本的音频波形。这是一种结构化的输出任务,但附加的条件是每个输入都没有一个正确的输出,我们明确希望输出有大量的变化,以使输出看起来更自然和真实。

解释没有提到这两个任务之间的任何区别。采样和合成,除了语言差异之外,我不知道任何区分机器学习任务的标准、质量或属性。

机器学习中的采样任务和合成任务的根本区别是什么?

1个回答

由于作者使用它们的方式不同,这些术语可能会令人困惑。底线是这个

合成任务基本上是指创建或合成新数据。数据的创建可以纯粹是确定性的,例如

.. 我们提供一个书面句子 .. 发出包含该句子口语版本的音频波形

但是,绝大多数时候,这样的创作有一个..

.. 增加了每个输入没有单一正确输出的限定,我们明确希望有大量的变化

这是通过统计抽样程序完成的。这个过程可以像 IID 抽样一样简单N(μ,σ)到更复杂的 MCMC 方法。

所以基本上,“综合”是一项更广泛的任务,可能包含“采样”程序。