mmydyet是从Hackernoon编译的

量子出品|公众号QbitAI

目前，作为处理图像生成问题的绝佳方法，生成对抗网络(GAN )在超分辨率重构、风格迁移等领域取得了许多有趣的成果。

(例如，量子比特是昨天推荐的去马赛克大法)

但是，GAN只是模仿怎么办？最近的新研究改善了GAN，教会了机器创造。

这些广受好评的画是美国罗格斯大学的计算机科学研究室、脸书人工智能研究部、查尔斯顿大学艺术史系联合发表的新论文，can : creative Adversarial Networksgenerating“art”

这篇论文提出了创造性对抗网络(Creative Adversarial Networks )，探索了利用机器生成创造性内容的可能性。

Hackernoon的发文介绍了这篇论文的主要内容，量子比特翻译如下：

在阅读本论文之前，希望你了解神经网络的概念和损失函数和卷积操作等基本概念。

GAN网络和CAN网络的几种生成图像

回顾GAN网络

GAN网络由两个斗争神经网络组成，分别称为生成器和分类器。

从字面上看，生成器的作用是基于输入生成数据。这个输入可以是噪音，也可以是其他类型的数据。分类器的作用是分析数据，区分该数据属于原始输入数据还是由生成器生成的生成数据。

一般来说，GAN网络可以被视为基于生成器和分类器的对抗游戏：

方程式1.0

简单版解释

如果你觉得上述方程式太复杂了，不要担心。接下来将分阶段介绍这个方程式，详细说明各部分的意思。

方程式1.1

上面是极大极小方程式的符号，文字g和d分别表示生成器Generator和分类器Discriminator。生成器的任务是最小化方程式1.0的值，同时分类器的任务是最大化方程式1.0的值。这两者在程序发出停止的命令之前，将不断进行竞争。

方程式1.2

如果输入x是来自原始数据集的数据，则分类器的输出指示它是真实数据。

方程式1.3

方程式1.3计算了分类器向生成器输入的输出值。 d(g(z ) )表示分类器判断为输入数据是真实数据的概率，1-d ) g ) z ) )表示分类器判断为输入数据是生成数据的概率。 g(z )表示由生成器生成的数据。

统一上述方程，得到分类器的任务是将以下方程最大化。

方程式1.4

生成器的任务是将方程式1.4的值，也就是方程式1.5的值最小化。

方程式1.5

有关GAN网络的更详细说明，请参见英属哥伦比亚大学的在线课程。

在线课程地址： http://wiki.UBC.ca/course : CPSC 522 /通用_通用_网络

从模仿到创造

生成器通过不断调整自身，使得分类器将生成图像标记为实际图像，分类器也不断调整自身，指出生成图像和原始图像的不同。

这不是简单的模仿吗？

某种程度上，是这样的。生成器的目标是愚弄识别器，使其认为生成数据与实际数据尽可能相似。那么，如何实现呢？通过使对应的输出与实际数据极为相似。

如何让互联网更有创意？

创造性的对抗网络来了！

论文的作者为了产生创意的内容，提出了改进的GAN网络： CAN。该网络应该如何通过向生成器发送附加信号来实现，以避免生成与原始数据过于相似的内容？作者在方程式中

1.4中修改了最初的GAN网络损失函数。

CAN简单解释

在原始的GAN中，鉴别器通过判断输入数据与真实数据的相似程度得到一个输出值，生成器就是根据这个输出值来修改其权重。CAN网络可以通过以下两种方式来扩展此过程：

1. 鉴别器不仅会判断数据是真是假，而且还可以确定该艺术图像的所属年代；

2. 生成器将会接收鉴别器中附加的年代信息，并使用该指标与鉴别器的（可真可假）输入进行联合训练。

改进目的

原始GAN网络的存在问题是不会探索新的内容，训练的唯一目标只是使生成数据与真实数据集尽可能相似。

通过对输入数据所属年代进行分类的附加度量，可能会带有置信度列表，生成器可以获得其生成数据与某个年代相似程度的反馈信息。

现在，生成器不仅要使生成数据与真实数据集相似，而且还要确保其与某个类别不过于相似。这条规则将限制生成器产生带有具体特征的艺术图像。

新的损失函数定义如下：

△ 方程2.0

真的很简单！

第一行与原始方程完全相同。但是要注意，下标r代表鉴别器的输出是真或是假，下标c为鉴别器分类的输出值。

第二行为提高创造性的改进点，接下来详细解释。

△ 方程2.1

上述公式使得鉴别器能正确获取输入图像的类别。鉴别器将会努力最大化该概率值，来正确得到输入图像的年代类别。

△ 方程2.2

这个方程可能看起来很复杂，但这只是定义了多标签交叉熵损失（Multi Label Cross Entropy Loss），这里的K表示图像类别的数目。在分类器中，也使用了该损失函数。生成器在训练过程中通过最小化该值来最大化方程2.0的值。

方程2.2的直观解释

方程2.2的作用是，如果某个类的得分值接近1或0，则整个方程的值接近于无穷大。

方程2.2可以取到最大值时，此时意味着鉴别器完全不确定输入图像属于哪一类，即上述方程中的计算和都相同，这也是生成器想完成的结果。

这是有一定依据的，因为如果鉴别器不可能将输入图像正确地分类到现有的某一类中，则意味着该数据与原始数据相同。

结论

本文讨论了一种能根据已有数据推进GAN网络探索新内容的损失函数，通过改进原有的损失函数来进行探索，期待更有趣的研究。

有名的艺术家(人民艺术家都有谁)