GAN首发一年后“AStyle-Based Generator Architecture for GANs”生成的人脸
Karras 等人的“ProgressiveGrowing of GANs for Improvement Quality, Stability, and Variation”(2017 年),也称为 PGAN 或 ProGAN。 AMAZING!
是不是很难看出真假?
那究竟如何识别这些AI 生成的“假”图像呢?别着急,福韵君教你找找GAN图像主动露出的“马脚”。
从“头”看起——头发的端倪
AI生成的图像,一般可以较为精细地处理人体的其他器官和部位,但对于头发的处理漏洞往往就会多一些。毕竟人的发型有很多的可变性,也有很多的细节,这使它成为 GAN 最难捕捉的细节之一。 你会看到“假”照片中的人物顶着像油漆刷出来的不自然的假发,僵硬、缺少弯曲弧度。
直发看起来像油漆
可以说看头发是识别 GAN 生成的“假”图像最快的方法之一。看这些束成一团的头发、在肩膀周围产生随机的头发,以及在前额上散落浓密的头发。
或者类似下图这样像P图失败的“拼接”头发。
“超现实”的背景和绘画渲染
GAN 中的人脸看起来可信的原因之一是所有训练数据都已居中。这意味着 GAN 建模时的可变性较小,例如,在眼睛和耳朵的放置和渲染方面。另一方面,由于实际背景可以包含的内容太多,GAN往往只能复制一般的背景纹理,而不能很好处理“真实”的背景场景。所以还会出现以下这样的诡异情况,比如照片中出现奇怪的“人物”,比如背景看起来像撕碎的一样。
GAN 可以组装一般场景,但目前在处理牙齿等半规则重复细节方面存在困难,即牙齿容易被渲染成各种奇怪的或不对称的形状,或产生错位,以不寻常的方式拉伸或收缩每颗牙齿。
如上图,一颗牙齿中间有一个空隙。在某些情况下,甚至会“变”出三颗门牙,如下面的最后一张照片所示。
这个问题也同样出现在了其他领域,比如使用砖块等图像进行纹理合成的时候。
非刻板印象的性别呈现
看下图就并不是一张所谓的“女装大佬”照片,而是由GAN生成的“假”照片。
这个 GAN 是在CelebA 的一个子集上训练的,其中包含 10k 名人脸的 200k 图像。
在上图的数据集中,我们没有看到一个留胡须、戴耳环和化妆的例子;但GAN 却经常混合不同性别的属性。因为 GAN 并不总是能很好地学习和理解人类社会范畴中的一些分类和属性(比如此处的“男性与女性”)。 需要说明的是,和不对称一样,非刻板印象的性别表现本质上并不是图像不“真实”的指标。与凌乱的头发不同,它不是单个图像中存在的视觉伪影,而是大量图像中匹配统计数据的差异。
半正规噪点和荧光渗透
半正规噪点(Semi-regular noise):一些原本为单色的区域可能会出现带有水平或垂直条带的半正则噪点。在上面的例子中,这可能是网络试图模仿布料的质地。较旧的 GAN 具有更突出的噪声模式,通常被描述为棋盘伪影(checkerboard artifacts)。 荧光渗透(Fluorescent bleed):有时候一些荧光色会从背景渗入头发或脸上。一些较浅的纯色区域可能出现多种色调,如衣领、颈部和眼白等。
如下图: