肺血管畸形

首页 » 常识 » 问答 » AI画人可谓一绝,但画猫就差强人意,我们
TUhjnbcbe - 2024/5/15 17:40:00

人工智能(AI)最近尝试从零开始生成猫的照片,结果却是一堆畸形猫。

你好,小猫咪们。Credit:Nvidia

这种特殊的神经网络(一种模仿人类大脑工作的人工智能)可以生成令人惊讶的人脸原始照片,非常逼真。事实上,人工智能的程序员在年12月发表在预印本《arXiv》杂志上的一项研究报告中称,人类几乎不可能将这些人的照片与真人照片区分开来。

然而,生成猫科动物则被证明是另一回事。生成完美人类面孔的算法,用在生成猫身上,却创造出了头部畸形的猫:眼睛和腿的数量不对,以及一些太长、太短、不寻常的圆形或长方形、以特殊角度弯曲的物体。

生成这些令人毛骨悚然的猫咪照片的人工智能引擎被称为“生成敌对网络的基于风格的生成器架构”,或称为StyleGAN。研究称,像这样的网络是具有“对抗性的”,因为两个模型同时工作:一个生成图像,另一个根据训练数据集中的照片评估结果,这样网络就能从错误中吸取教训,提高性能。

人工智能要生成逼真的人类图像,首先必须从现有的照片中“学习”人脸的样子。该算法将人脸分解成样式特征列表,如头部位置、性别、肤色、头发的质地和风格,除此之外,还有眼睛、鼻子和嘴巴的形状。

一旦StyleGAN能够在没有人类监督的情况下,识别出所有这些元素,它就学会了独立地将它们组合起来,生成一张全新的、逼真的人脸。研究人员拒绝了采访请求,但在年12月12日上传至Youtube的视频中解释了他们的处理过程。

那么,为什么StyleGAN不能创作出逼真得可爱的猫咪照片呢?算法它自己以及经历了——但当它面对猫咪时,数以千计的参考图像使用起来并不理想,JanelleShane说道,他是一位训练神经网络的研究人员,但并没有参与这项研究。

2月7日,Shane在她的博客AIweird中写到了这些奇怪的猫。与StyleGAN的人脸照片数据集不同,StyleGAN所使用的照片数据集中,身体和背景都被裁剪出来,头部的位置彼此相似,而Shane所使用发数据集中,猫的图像变化很大。该系列包括在一系列设置和不同的背景下,猫的特写和广角镜头。一些照片上是一只猫,一些照片上是多只猫,还有一些照片上是人。

“有倒立的猫;有蜷缩成一团的猫;它们的眼睛有的是睁开的,有的是闭着的。你可以肯定地说,他们输入的数据有点嘈杂——我所说的嘈杂,是指这些并不是只有一张猫的照片,”Shane说道。

所以,不要因为StyleGan生成了一群可怕的噩梦般的猫而对它太苛刻。Shane补充道:“算法还需要学习更多的东西。”

Credit:Nvid

虽然StyleGAN生成的人类逼真的完美无缺,但神经网络却难以生成猫科动物。

相互矛盾的视觉线索让StyleGAN很难了解一只真正的猫应该长什么样。神经网络对于它们所得到的信息,无法结合环境来考虑;它们只知道数据集中有什么。StyleGAN从参考图片中学到了足够多的东西,可以精确地复制小细节和纹理,比如猫的皮毛或者猫耳朵的形状。但Shane表示,这个项目显然很难把整只猫放在一起。

“神经网络不理解猫是怎么组成的。它不知道它们有多少条腿。目前还不清楚它们有多少只眼睛,也不清楚它们的身体构造都怎么拼在一起的,”Shane解释道。

在开发平台GitHub上可以看到更多StyleGAN生成的那些令人不安的猫咪照片、近乎完美的人类图片和其他项目文件。

1
查看完整版本: AI画人可谓一绝,但画猫就差强人意,我们