处理生成数据的数据科学分支是什么?寻找教程

数据挖掘 Python 张量流
2022-03-11 18:14:56

到目前为止,我一直关注的所有教程(Python/Tensorflow)都是处理数据的,它们是分类问题。给出是或否答案的事物。现在我想找到有关使用 ML 从大型数据集中实际创建事物的教程。

例如,假设任务是使用数百万张人脸照片生成人脸。这不是从数据中产生统计的问题,而是使用统计产生数据的问题。我的理解是,该算法会生成随机图像并通过分类器运行它们,直到它们与人脸非常相似。这是人工智能吗?我不会认为它是智能的任何东西。我知道生成图像还需要大量的创造力。但是假设我只想在每个像素上使用 +-RNG。是否有一个自适应过程,它会在更高的卷积级别开始匹配,其中图像只是信息块,然后使用该信息,添加或减去颜色、边缘等,以移动到更接近于面部的更低级别。

这种类型的问题叫什么,在搜索教程时我应该寻找什么。如果有一个告诉你如何做类似的事情,你能指出我吗?

谢谢

1个回答

这被称为生成模型,它们基本上是根据训练示例推断数据的概率。算法通常具有判别性,即它们通过估计来执行预测:

p(Y|X)

因此,鉴于您的数据,他们能够预测标签。

生成模型感兴趣p(X)即数据是如何生成的。一旦模型了解到这一点,它就可以生成看起来像您输入的“假”图像。

你可以看看:

  • 生成对抗网络(最近引起了很多关注)
  • 变分自动编码器(在引入 GANS 之前很流行)