StackGAN 使用什么样的算法从文本中生成逼真的图像?StackGAN 是如何工作的?
StackGAN 使用什么样的算法从文本中生成逼真的图像?
人工智能
计算机视觉
参考请求
生成对抗网络
图像生成
2021-10-24 11:41:50
1个回答
论文StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks应该可以回答您的问题。
这是论文摘要的摘录。
从文本描述中合成照片般逼真的图像是计算机视觉中的一个具有挑战性的问题,并且具有许多实际应用。现有文本到图像方法生成的样本可以大致反映给定描述的含义,但它们无法包含必要的细节和生动的对象部分。在本文中,我们提出了堆叠生成对抗网络(StackGAN)来生成以文本描述为条件的照片般逼真的图像。Stage-I GAN根据给定的文本描述绘制对象的原始形状和基本颜色,产生 Stage-I 低分辨率图像。第二 阶段GAN 将 Stage-I 结果和文本描述作为输入,并生成具有逼真细节的高分辨率图像。Stage-II GAN 能够纠正缺陷并通过细化过程添加引人注目的细节。
其它你可能感兴趣的问题