首页 > 编程知识 正文

人工智能通过输入的图片(谷歌判断人工智能)

时间:2023-05-05 20:31:15 阅读:97960 作者:951

相信你可能看过一些展现未来科技的科幻电影或者电视节目。在这些电影或电视节目中,主角会要求放大一些图像,增强显示效果:清晰显示人脸、车牌或其他任何关键细节。现实中,谷歌最新的人工智能引擎,基于众所周知的扩散模型,可以做到这一点。

事实上,这是一个很难掌握的过程,因为本质上发生的是一些基于其他类似图像的超智能猜测添加(补充)了相机一开始没有捕捉到的图像细节。

这项技术被谷歌称为“自然图像合成”,在这种特殊情况下,被称为图像超分辨率。你从一张小的、块状的、像素化的照片开始,最后得到一张清晰、锐利、自然的照片。它可能与原始图片不完全相同,但对于人眼来说,它足够接近现实。

谷歌实际上已经为这项工作推出了两个新的人工智能工具。第一种叫做SR3,即通过反复细化实现超分辨率。它的工作原理是在图像中加入噪声或不可预测性,然后反转过程将其删除3354,就像图像编辑器试图让你的度假照片更清晰一样。

谷歌的研究科学家和软件工程师解释说:“扩散模型通过逐渐加入高斯噪声来破坏训练数据,慢慢消除数据中的细节,直到变成纯噪声,然后训练神经网络来逆转这种破坏过程。”

基于一系列巨大的图像数据库和机器学习的一些神奇的概率计算,SR3可以想象出块状低分辨率图像的全分辨率版本是什么样子。

第二个工具是CDM,即级联扩散模型。谷歌将这些描述为“管道”,通过管道可以引导扩散模型(包括SR3)升级高质量图像的分辨率。它使用了增强的模型,并从中获得了更大的图像,谷歌也发表了一篇关于这方面的论文。

上图:动画展示了CDM方法的原理。

谷歌表示,通过在不同分辨率下使用不同的增强模型,CDM方法可以击败其他放大图像的方法。新的人工智能引擎已经在ImageNet上进行了测试,ImageNet是一个巨大的训练图像数据库,通常用于视觉对象识别的研究。

SR3和CDM的最终测试结果令人印象深刻。在一项由50名志愿者参与的标准测试中,SR3生成的人脸图像被误认为真实照片的概率为50%。考虑到一个完美的算法有望达到50%的分数,这是令人印象深刻的。

值得重申的是,这些增强后的图像与原始图像并不完全匹配,而是基于高级概率数学精心计算的一些模拟。

谷歌表示,扩散方法比其他选择产生更好的结果。包括生成对抗网络(GAN),其原理是使两个神经网络相互竞争以提高结果。

谷歌从其新的人工智能引擎和相关技术中获得了更多希望。这不仅适用于放大人脸和其他自然物体的图像,也适用于概率建模的其他领域。

该团队表示:“我们非常乐意进一步测试扩散模型的极限,以解决各种代建模问题。”

如果朋友喜欢,请注意“知新”!

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。