蒸馏瓶(微软系统)

今天介绍来自阿德莱德大学、亚洲微软研究院、北航的关于CVPR2019语义分割的论文。

研究了利用大型网络训练小型语义分割网络的知识提取策略。从简单的像素蒸馏方案开始，将图像分类中采用的蒸馏方案应用于图像分类，对每个像素分别进行知识蒸馏。语义分割是一个结构化的预测问题，进一步提出了将结构化知识从大网络提取到小网络中。我们研究了两种结构化蒸馏方案：(I)的配对蒸馏，提取了配对相似性； ) ii )蒸馏整体，用GAN提取整体知识。通过对三个场景分析数据集Cityscapes、Camvid、ADE20K的大量实验，验证了知识提取方法的有效性。

介绍

语义分割是预测输入图像中各像素类别标签的问题。它是计算机视觉中的基础性工作，具有自动驾驶、视频监控、虚拟现实等诸多现实应用。全卷积神经网络(fcns(38 )问世以来，深度神经网络是语义分割的主流解决方案。之后的deep lab [ 5，6，7，48 ]、PSPNet[56]、OCNet[50]、Re- fineNet[23]、DenseASPP[46]等方法在分割精度上有了显著的提高，但往往

近年来，由于对移动设备的应用需求，模型尺寸小、计算量小、分割精度高的神经网络备受关注。目前的研究主要集中在轻量级网络的设计上，专门用于分割或参考ENet[31]、ESPNet[31]、ERFNet[34]、ICNet[55]等分类网络的设计。本文的研究方向是精简分割网络，重点是利用冗馀网络训练精简网络，提高分割精度。

正文的主要贡献：

研究了训练精密紧凑语义分割网络的知识提取策略。

提出了两种结构化知识精馏方案：对精馏和整体精馏，在紧凑复杂的分段网络输出之间实现了对和高阶一致性

如图1所示，在三个基准数据集Cityscapes[10]、CamVid[4]和ADE20K[58]中，最近开发的最先进的紧凑细分网络ESPNet、移动ETV2- PPP

方法

本文流程图：

实验和结果

论文地址：

3359 arxiv.org/pdf/1903.04197.pdf