在好莱坞的犯罪电影中,侦探们经常看到在计算机jkddx的帮助下破案。 他们可以从模糊低质量的图像中找到隐藏的信息。 从技术上讲,电影中的黑魔法被称为(SISR )
在各种sisr APP应用中,车牌超分辨率以其巨大潜力绝对名列前茅。 例如,它可以用于执法,也可以用于提高车牌识别和道路识别(地图服务)的准确性。
本文介绍我是如何使用Python实现车牌图像增强的。
在详细讨论
展示
模型体系结构和培训战略之前,请展示模型的能力。 从下面的照片可以直观地感觉到。
在逃生事故的情况下,多存在在车牌照片较暗的条件下用低质量的相机拍摄的问题。 针对这个问题,我们的模型不仅可以提高分辨率,还可以通过图像去噪、调整亮度和对比度来提高车牌的可读性。
系统架构
预处理
我们在本项目中使用的数据集是中国城市停车场数据集CCPD,包含200k不同条件的汽车图像。 但是,原始数据不能直接使用。 因为只需要车牌图像而不是街景或汽车,所以第一步是使用数据集提供的标注从图像中剪切车牌图像。
此外,我们还过滤了亮度和对比度差的图像,只留下优质的图像进行了使用。 我们人工处理了车牌图像数据(input,label )。 其中,输入经过降采样和噪声,是同时随机进行亮度和对比度的“破坏性”处理,标签不变。
模型详细信息
我们的机型受到了ESRGAN机型的启发。 不安的马里奥,我们的模型继续进行抗性训练获得识别能力——生成器和识别器相互对抗。
生成器
。我们的生成器在两个前沿模型上建立了——ESRGAN的RRDB网络和残差密集网络。 生成器使用子像素卷积(在tensorflow中为tf.depth_to_space,在Pythorch中为Pixel Shuffle ) )在低分辨率图像上进行8倍的采样。 与大多数情况一样,子像素卷积旨在将10 x 10 x 64大小的要素贴图压缩为深度较浅的大要素贴图(如果顶部采样率为8,则为80 x 80 x 1)。
鉴别器
识别器使用简单的VGG样式网络输出0 (假)或1 (真)。 理想情况下,分类器应该能够区分重建图像和实际图像。
添加分类器比使用最小化均方误差的生成器更有效。 个性太阳倾向于产生与合法文字完全不同的过度光滑的伪像。 使用分类器约束输出空间有助于创建相似的字符重建。
损失函数与评估
车牌图像重建的一个问题是均方根误差和峰值信噪比等一般指标在描述高层特征方面并不擅长。 例如,模糊重构可能比偏移亮度和高对比度重构提供更高的PSNR。
因此,聚焦边缘和字母方向等高级特征非常重要。 在SRGAN的论文中,研究者们发现了新的内容损失函数。 该函数计算了VGG网络特征空间中的均方误差,强调了原始图像的特征而不是图像空间中的均方误差。 他们避免了VGG损失
本模型中使用的损耗函数是VGG损耗和MSE损耗的混合。
如果内容丢失,则模型在重建过程中必须注意边,以确保高级骨架与真实值匹配。