首页 > 编程知识 正文

对空洞卷积的理解是什么,对空洞卷积的理解是

时间:2023-05-06 09:16:31 阅读:270490 作者:1245

一、空洞卷积:
不用池化层,因为池化在提供更大的感受野的同时,分辨率降低,会导致空间信息丢失,数据丢失。空间卷积可以避免使用down-sampling,并且在相同的计算量的前提下,提供更大的感受野。
设置不同的dilation rate,感受野就会不同,就会有多尺度的信息。

在原始特征f0上进行扩张率为1(普通的卷积)的空洞卷积生成f1,f1的一点相对f0感受野为3 * 3

如图,在f1上做2-dilated的3 * 3卷积,生成的f2上的一点相对于f0感受野为7 * 7;若仍用普通3 * 3的卷积,则生成的f2上的一点相对于f0感受野为5* 5;扩大了感受野,让每个卷积输出都包含较大范围的信息。

二、空洞卷积感受野计算
空洞卷积实际卷积核大小:

K=k+(k-1)(r-1),k为原始卷积核大小,r为空洞卷积参数空洞率;

三、空洞卷积的问题

1、第一张图一张图片连续进行2-dilated的3 * 3卷积,生成13 * 13的感受野,但我们的感受野不连续,会损失信息的连续性。
2、对于大物体的分割,我们用大dilated的空洞卷积比较合适,对于小物体的分割,并不友好,那我们对于同时检测大物体与小物体并不能有效的同时进行。

解决办法:
运用HDC,例如运用[1, 2, 3]的dilated,感受野都是13 * 13,且没有信息丢失

HDC三个特性:
第一个特性是,叠加卷积的 dilation rate 不能有大于1的公约数。比如 [2, 4, 6] 则不是一个好的三层卷积,依然会出现 gridding effect。
第二个特性是,我们将 dilation rate 设计成 锯齿状结构,例如 [1, 2, 5, 1, 2, 5] 循环结构。
第三个特性是,我们需要满足一下这个式子:

其中 r_i 是 i 层的 dilation rate 而 M_i 是指在 i 层的最大dilation rate

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。