VAE全面理解(上)

IT教程 11个月前 https://55wd.com
1,427

vae

忏悔

前段时间学习了《Auto encoding variational bayes》这篇文章,处于种种原因,还写了一篇博客,https://blog.csdn.net/qq_31456593/article/details/77743840,近日想要自己再重新复习一下,发现当时的理解是相当的不到位,叙述也是模棱两可的,花了很大力气,又重新看了两天,有了许多新的理解,我决定把它写下来。当然认知水平的高低不可能一蹴而就,我希望下次我继续读这个内容的时候又会有新的理解。

1)关于VAE还是AEV

在上一篇博客中,我主要学习的是《Auto encoding variational bayes》这篇文章,所以我自作主张的讲它缩写为AEV。这几天,在大量阅读相关文献博客期间,发现,卧槽,人家叫VAE,全称variational auto encoding。经验主义害死人,看文献细看几眼总归是不会有错的。

言归正传,那么什么是VAE呢?简单来讲,一个可以和GAN相媲美的生成网络。我们可以输入一个低维空间的Z,映射到高维空间的真实数据。比如,生成不同样的数字,人脸,卡通头像等等。

VAE全面理解(上)

讲的天花乱坠,不如一张图片来的实在,上图就具体展示了VAE的作用,作图是经过一轮训练之后的输出结果,中间的图是经过9轮训练之后的输出结果,而右图就是我们真实地数据。(这里我猜测是将图片先编码,再解码这个全过程,而不是仅仅通过一个随机量去生成)。

2)VAE与GAN之间的差异性

既然VAE与GAN都是属于最近很火的生成网络序列,那么他们之间有什么不同呢?

假设,给定一系列猫的照片,我希望你能够对应我随机输入的一个n维向量,生成一张新的猫的照片,你需要怎么去做?对于GAN就是典型的深度学习时代的逻辑,你不是不清楚这个n维向量与猫的图片之间的关系嘛,没关系,我直接拟合出来猫的图片对于n维向量的分布,通过对抗学习的方式获得较好的模型效果,这个方法虽然很暴力,但是却是有效的。

VAE则不同,他通过说我希望生成一张新的猫脸,那么这个n维向量代表的就是n个决定最终猫脸模样的隐形因素。对于每个因素,都对应产生一种分布,从这些分布关系中进行采样,那么我就可以通过一个深度网络恢复出最终的猫脸。VAE相比较于GAN它的效果往往会略微模糊一点,但是也不失为一种良好的解决方案。并且相对于GAN的暴力求解,VAE的建模思路无疑要复杂的多,它更能体现理科思维的艺术感。

3)VAE初识

想象这样一个网络,输入是一组全部为一的向量,目标是一张人脸,经过好多好多轮的训练。我们只要输入这个全部唯一的向量就可以得到这张你熟悉的脸。其实这是因为在训练的过程中,我们通过不断地训练,网络已经将这张人脸图片的参数保存起来了。

VAE全面理解(上)

这个工作其实已经可以看出他的意义所在了,通过一个网络,将一个高维空间的人脸映射为低维空间的一个向量。那么如果我将这个向量定义为四维,采用one-hot的表达方式表达四张不同的脸,那么这个网络就可以表达四个脸,emm,你输入不同的数据,他就会输出不同的脸来。

VAE全面理解(上)

你也许会说,那这个几维向量又代表什么呢?如果每增加一个脸就要相应增加空间的维度,那么这个过程也就太不科学了吧。嗯,科学的是,以上只是我随手为了方便大家理解举的例子,其实,在实际应用中,这个维度往往代表的是决定最后成型的各个因素,大家往往称之为隐形因素,也就是在大量的博客推导中我们所看到的Z。在下面这个图中,我们通过六个因素来描述最终的人脸形状,而这些因素不同的值则代表了不同的特性。

VAE全面理解(上)

是不是有朋友会觉得,那你这个VAE到底有什么用呢,就为了把大量的数据存储到网络结构中去呀,当然不能是这么简单的一个事。想象一下,在一个末日大片中,我们需要去搞出一个许多机器人占领世界的场面,但是我们的特效师一张张去画,这无疑会是一个令人头疼的工作,利用VAE,只需要使用有限的数据输入,我们就可以通过隐形参数的调节,获得几乎无限的数量。

有人也许会问了,你为什么可以生成从来没有出现过的图片。这里就要介绍一下VAE中的编码器,对于每个隐性参数他不会去只生成固定的一个数,而是会产生一个置信值得分布区间,这是一种连续的表达方式,通过采样,我们就可以获得许多从来没有见过的数据了。

VAE全面理解(上)

这一篇先到这里,更多内容请阅读《VAE全面理解(下)》

参考:

1、VAE(Variational Autoencoder)的原理

2、https://www.jeremyjordan.me/variational-autoencoders/

3、读论文《Auto-Encoding Variational Bayes》

4、变分自编码器VAE:原来是这么一回事 | 附开源代码

戴尔灵越7000性能如何 dell灵越7000笔记本性能全面图

戴尔灵越7000怎么样?性能如何?值不值得买?下面小编带来dell灵越7000笔记本性能全面图解评测,希望对大家有所帮助。dell灵越7000笔记本

HUAWEI MatePad pro值得入手吗 华为平板MatePad Pro全

HUAWEI MatePad pro值得入手吗?华为已经拥有如HUAWEI Mate 30 Pro、HUAWEI MateBook X Pro、华为子母路由 Q2 Pro等多款以Pro为后

浅谈对原子锁的理解

对原子atomic操作的理解 前言 我们知道,当我们修改某一个变量的时候,在汇编层面看来,至少需要细分为“读->改->写”三个过程,也就是说

开发www.miibeian.gov.cn的JAVAEE大师 -- I 服了油

今天申请网站备案,弄了3个小时,信息仍然没有成功录入完成.就这么一点点的东西让我浪费了三个小时啊,还没有完成.我想是政府的问题

私货分享:设计师如何全面提升自己的工作效率?

如何有效提高工作是每一个职场人都十分关注的点,今天作者就此展开分享,希望你能从文中收获点滴。工作效率是个老生常谈的话题,但是对

文章回顾

大家看了本文VAE全面理解(上)的精彩教程资源内容,是不是对VAE全面理解(上)了解更多,真心希望VAE全面理解(上)能帮助到你, 小编会一直给你带来更多教程资源文章信息。

版权声明:e4a445b7f4f4823b 发表于 2020-02-23 19:41:17。

本文由第三方用户分享仅代表作者观点,不代表本网站立场,秉承互联网开放分享的精神,目的在于传递更多信息,加强各行业互通交流,但对内容不作任何保证或承诺,请读者自行参考斟酌。网站发布的信息(包含但不限于版式、图片、字体、文章等素材)由第三方用户分享,版权归原作者所有,本站不承担任何相关的版权纠纷等相关责任。如您认为本篇内容侵犯了您的权益,请与我们联系,我们会及时处理。

豌豆资源网专注分享全网综合资源网站大全,致力于超实用的内容资源搜索。

转载请注明:
本文标题:VAE全面理解(上)
本文地址:https://55wd.com/s12020/

你可能感兴趣

随便逛逛