关注后,“星标”简说谁都可以轻松入门Python。 Python、爬虫、数据分析简为Python推荐来源:扩展粉丝EXTFANSOneoldwatch,likebrief python
马赛克的发明,据说是人类文明史上最大的“后退”。
也有人说马赛克是阻碍人类进步的障碍。
在功能上,马赛克是隐藏原始画面的手段,既成为有利也成为缺点。
技术上,马赛克的原理是将某个像素的颜色填充到整个范围内,从而失去原始信息。
所以,这个过程是不可逆的。
在个人隐私极易被泄露的互联网时代,图像上的敏感信息可能会被马赛克掩盖。
例如,身份证号码、姓名、地址用马赛克隐藏,可以有效地达到保护信息安全的目的。
但是,同样地,在电影和漫画作品中,每当有孩子不恰当、血腥暴力的场景时,很可能会伴随着厚厚的马赛克。
即使是像样的影像也打上马赛克的话,画风会变得奇怪。
老司机的门早就达到了“心中没有代码的自然高清”的最高境界。 但是,有代码的观察,总是隔靴搔痒,就像鲣鱼在喉咙里一样。
俗话说,XX是第一科技生产力。 人类世界出现马赛克之后,当然也有人会集中精力解开电线。
过去,可以去除马赛克的软件层出不穷,但大多是挂羊头卖狗肉的恶意软件。
但是,最近在Github上出现了据说可以消除马赛克再现原画的神器,引起了国内外的热议。
该工具的名称为Depix,上线不到几天,GitHub就有超过1万个上标星,迄今累计分支也超过了1.3k。
把那个从圈里拿出来的是以下效果图。
如图所示,第一行是经过巨大马赛克完全像素化的文本内容,一点也看不到原始痕迹。
可以看出,第2行是由AI恢复的内容,内容实际上几乎已经恢复,精度很高。
第三行是对第二行稍加推理而得到的原始密码。
是的,最难恢复、理论上完全无法恢复的字符也是在厚厚的代码后被Depix恢复的!
即就算大家以后把姓名/身份证号/电话等个人敏感信息都打上了马赛克发布到网上,也有可能被别人扒得一干二净。
那么,这个不可思议的AI还原技术是如何实现的呢?
据项目作者介绍,使用Depix将镶嵌的文字恢复成原来的画,只需要简单的4个步骤即可。
从屏幕快照中剪切像素块作为选区。
在具有相同字体设置(如文本大小、字体、颜色和hsl )的编辑器中,粘贴具有所需字符的De Bruijn序列。
使用与创建尽可能像素化的图像相同的屏幕快照工具创建序列的屏幕快照。
运行以下命令:
pythondepix.py-p [ pixelatedrectangleimage ]-s [ searchsequenceimage ]-o output.png图像像素化处理的一种手段,使图像特定区域的灰度降低,颜色
线性盒滤波器是常用的处理算法之一。
如下图所示,标记一个表情图像后,实际上被分成4个颜色块,每个颜色块被颜色块的平均值复盖,最终变成像素化的表情。
由于原始信息丢失,无法直接反转过滤器。
利用线性盒滤波器对每个颜色块单独处理的特征,该Depix算法在搜索图像中的每一块像素化以直接搜索匹配。
简单来说,Depix的技术原理是将马赛克区域的内容分割成多个小块,采用算法来平均化并复盖各个块的内容等。
目前,名为Depix的工具是一个特定领域的工具,仅适用于使用线性块滤波器创建的像素化图像,主要支持字母、数字、半角符号等。
测试结果显示,大多数英文字母、数字和符号都可以通过Depix正确识别。
但是开发人员在研究过程中发现一些连写文字不能正确识别,必须加以改进。
Depix算法的输出结果不太完美,但比以前的其他技术好很多。
关于Depix的信息在网上传播后立即引起话题,很多网友对该技术深表担忧。
开发者强调,开发这个AI项目不是为了窃取信息,而是为了利用ECB和明文攻击的模式,提高信息保护技术。
他还在博客上建议,出于安全考虑,不要使用马赛克。 最好的做法是直接用黑色或白色条覆盖需要阻止的区域,而算法无法撤消。
当然,Dep除外
ix以外,试图对马赛克内容进行还原的开源项目还有很多。此前,扩展迷也跟大家介绍过一款名为PULSE的算法——它能根据模糊的马赛克像素“画”出一张新的人脸,在几秒内就能将图像原始分辨率放大64倍,任何渣画质都可以秒变高清、逼真图像。
细致到眉毛、睫毛、毛孔、皱纹、头发,都能神还原。
对于这类项目的火爆,网上的质疑声一片,这些AI技术不可避免地被有些人用于不良或非法用途。
可以预见的是,AI还原马赛克技术将会越来越成熟,未来关于去马赛克的伦理道德、法律层面的问题也会越来越复杂。
GitHub地址
https://github.com/beurtschipper/Depix
【书籍推荐】《Java高并发编程指南》
简说Python长按扫码关注,一起学Python学习更多:整理了我开始分享学习笔记到现在超过250篇优质文章,涵盖数据分析、爬虫、机器学习等方面,别再说不知道该从哪开始,实战哪里找了