首页 > 编程知识 正文

蒸馏瓶(微软系统)

时间:2023-05-04 14:57:06 阅读:79337 作者:2164

今天介绍来自阿德莱德大学、亚洲微软研究院、北航的关于CVPR2019语义分割的论文。

研究了利用大型网络训练小型语义分割网络的知识提取策略。 从简单的像素蒸馏方案开始,将图像分类中采用的蒸馏方案应用于图像分类,对每个像素分别进行知识蒸馏。 语义分割是一个结构化的预测问题,进一步提出了将结构化知识从大网络提取到小网络中。 我们研究了两种结构化蒸馏方案:(I)的配对蒸馏,提取了配对相似性; ) ii )蒸馏整体,用GAN提取整体知识。 通过对三个场景分析数据集Cityscapes、Camvid、ADE20K的大量实验,验证了知识提取方法的有效性。

介绍

语义分割是预测输入图像中各像素类别标签的问题。 它是计算机视觉中的基础性工作,具有自动驾驶、视频监控、虚拟现实等诸多现实应用。 全卷积神经网络(fcns(38 )问世以来,深度神经网络是语义分割的主流解决方案。 之后的deep lab [ 5,6,7,48 ]、PSPNet[56]、OCNet[50]、Re- fineNet[23]、DenseASPP[46]等方法在分割精度上有了显著的提高,但往往

近年来,由于对移动设备的应用需求,模型尺寸小、计算量小、分割精度高的神经网络备受关注。 目前的研究主要集中在轻量级网络的设计上,专门用于分割或参考ENet[31]、ESPNet[31]、ERFNet[34]、ICNet[55]等分类网络的设计。 本文的研究方向是精简分割网络,重点是利用冗馀网络训练精简网络,提高分割精度。

正文的主要贡献:

研究了训练精密紧凑语义分割网络的知识提取策略。

提出了两种结构化知识精馏方案:对精馏和整体精馏,在紧凑复杂的分段网络输出之间实现了对和高阶一致性

如图1所示,在三个基准数据集Cityscapes[10]、CamVid[4]和ADE20K[58]中,最近开发的最先进的紧凑细分网络ESPNet、移动ETV2- PPP

方法

本文流程图:

实验和结果

论文地址:

3359 arxiv.org/pdf/1903.04197.pdf

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。