我们可以对抗深度伪造吗?

人工智能 社会的 深假货
2021-10-22 18:09:32

我遇到了“Amber”(https://ambervideo.co/),他们声称他们已经训练他们的人工智能来寻找由于人工创建的视频而出现的模式,这些视频是肉眼看不见的。

我想知道创建 deepfakes 的人也可以使用他们的 AI 来消除这些缺陷,因此问题归结为“猫鼠”游戏,在这种游戏中,拥有更多资源(训练他们的 AI)更为重要。

我不在人工智能和视觉领域工作,所以我可能会错过该领域的一些琐碎要点。如果能提供详细的解释或相关资源,我将不胜感激。

编辑:大多数确实操纵媒体新闻或制造假新闻的人比普通公民能负担得起更多的资源。那么,未来真的会是一片黑暗,只有少数强者比今天更能控制社会吗?

我的意思是即使有照片店制作的假照片,大多数好的照片店照片确实需要很长时间才能制作。但是,如果可以训练人工智能来做到这一点,那么它更多的是拥有大量资源。有没有相关的作品让人们希望从赝品中辨别真假?

PS:我意识到在编辑之后,问题也与这里的主题标签相切。如果有相关标签,请告诉我。

3个回答

我认为这款游戏会变得非常疯狂,因为在某些时候,生成器 AI 将能够生成绝对完美的图像。实际上,不,只是足够完美,没有人工智能可以确定它们是真的还是假的。

所以,我认为 AI 之战将不仅仅局限于图像,探测器 AI 可能会进化来分析这段视频在逻辑上是否合理,例如通过跟踪名人的位置来证明他/她不可能是,例如,让我们这样说,对他/她的伴侣不忠诚。

我的意思是,目前,人工智能可以判断一张图像是假的还是不比人类好,因为它看到的样本比我们多一百万倍,但是如果我们知道图像中的人是谁,我们就和人工智能一样狡猾我刚才描述了,我们可能会发现这个图像是不可信的。

当然,会有反测量。但是,到那时,我们不妨让人工智能统治世界,因为它会变得如此聪明(笑)。

但是,说真的,如果它足够聪明,能够在这个“现实世界”的问题上想得这么远,那么强大的人工智能就近了。

当 mshlis 开始接触时,是的,我们可以。然而,这将是一场无休止的战争。这有很多原因。一方面,问题本身并不简单。目前,deepfakes 框架有许多不同的“版本”,您创建的任何用于尝试发现它们的算法都必须适用于所有不同的迭代。另一个原因是用于对抗它的系统很容易被愚弄(参见参考资料)。

然而,最明显和无休止的问题来自架构本身。假设我们创建了一个完美的算法,它万无一失且极其准确。即便如此,你所要做的就是在训练你的 deepfake 模型时使用该算法作为鉴别器,然后 bing-bang-boom,你的 deepfake 检测模型就被破坏了。

声音和图像处理必然会产生伪影。在层层叠叠的边缘周围有这样的。面部替换和其他更多以表面或对象为中心的操作会产生不同类别的伪影。一个结构良好的 LSTM 或 GRU 网络和操纵帧序列的数据集以及操纵它们的用户(鼠标和键盘)事件可用于从新图像中产生对事件集的良好猜测。将未经处理的图像添加到数据集中可以允许无事件情况。这将是监督的方式来做到这一点。有些无监督方法需要的培训资源要少得多,这家旧金山解决方案提供商可能就是这种情况。

无论哪种情况,升级问题都是一个好问题。人们还可以创建一种设备,从当前的机器学习状态构建,隐藏现有检测软件的操作。如果他们具有前瞻性思维,那么同一个提供商可能已经开发了它。

我们可以对抗深度伪造吗?......我想知道制造深度伪造的人是否可以使用他们的人工智能来消除这些缺陷......

是的,是的。在战争中,战斗人员学习对方战斗人员的方法并适应。理论上,针对战略变化的检测机制也是可能的,这也是军事研究机构在更高形式的人工智能上花费如此多的原因之一。

对问题的编辑也不完全相切。

如果我们提出(有些人提出)虚拟现实可能会损害人类文化或个人心理,那么普通公民可能会被公司认为是战斗领域的附带损害,这​​些公司希望从其人工智能开发中获得良好的财务回报。当然,我们可以对音乐中减五度的使用说同样的话。相隔六个半音的两个音符产生的不和谐频率比为1:2. 几个世纪前,减少的五分之一在欧洲被认为是潜意识的撒旦,并被法律禁止在音乐作品中使用。据称,玻璃口琴让听众发疯。

从人类学的角度来看,我们物种的一个标志可能是操纵外表。在帧和音频中寻找假货可能是徒劳的,而我们没有升级。当前重要的研究领域是研究哪些遗传因素导致了人类的想象、设计和制造能力。知道这一点之后,我们可能有一个更好的窗口来了解我们玩的猫捉老鼠游戏是否对我们的物种未来具有任何可持续价值。热爱竞争的人相信它会加强,这是可能的。也有可能,这些游戏只是我们成为主要哺乳动物物种的痛苦道路的产物,不再具有任何特殊用途。“对别人做你希望他们对你做的事”是我们也不能忽视的真理之环。

如果我们从更广阔的角度来看,我们可以看到我们的娱乐选择倾向于(在没有偏见的情况下)可能被视为深度伪造的东西。娱乐业在声音和图像捕捉、合成和处理方面创造了卓越的收入,为整个城市提供了动力。故事情节不一定代表深刻的真理。这是更公开的。

在更隐蔽的一面,有些人将假动作伪装成现实,作为他们自己游戏中为实现某些目标而采取的举措,但这在我们的文化中也不例外。公共关系和营销领域以创造和保存商业价值为基础。政府、教育和社区的一些要素是建立在保全经济信念的基础上的。其目的可能是为了使他人受益或击败他人并获得个人财富。

我们中的一些人寻求真实性,并希望造假者赢得战斗,但似乎他们可能处于失败的一方。

这个问题和这个答案是否与这个 Stack Exchange 社区有关?绝对地。该社区在 SE 社区下拉列表中的描述为:“对于在纯数字环境中可以模仿‘认知’功能的世界中的生活和挑战的概念性问题感兴趣的人。” 人工智能最终是站在扮演人的一边还是向他们提供信息,这当然与这个已发表的关于这个社区目的的观点有关。