2d转3d效果怎么样(3D光线跟踪怎么用)

机械之心报道

编辑：张倩、小舟、小蛋

万物都可以转3D。

上班的时候想旅行，休假的时候想躺下，这是很多年轻人的状态。如果能躺在床上旅行，不是很美吗？

古代中国也有“卧游”的故事，游泳穿鞋的都在室里，可惜当时的技术条件不行，只能欣赏画卷的美景。

面对新型冠状病毒大爆发的蔓延，人们不得不限制外出，取消各类旅游计划，“卧游”的需求也更加迫切。当然，这个需求可以通过VR、AR技术满足，但是要想展现出身临其境的感觉，需要足够逼真的3D图像。

在此期间，加州大学伯克利分校、谷歌的研究人员可以通过开源将有效的2D图像转换为3D模型——NeRF，使用少数静止图像生成多视点的真实3D图像。

射频模型演示。论文和项目地址： https://万维网.安静的热狗.com/nerf

但是，这个模型也有缺点。如果环境中有明显的光变化或因人或物的移动而产生的遮蔽，则模型的性能会大幅降低。在需要展示户外景点的场景(如“卧游”)中，NeRF的应用范围可能非常有限。

谷歌的团队也看到了这个缺陷，在最近的研究中发表了NeRF模型的改良版3354nerfinthewild(nerf-w )，使之充满光的变化，适合被遮挡的室外环境。

目前，研究者将NeRF-W应用于一些具有挑战性的自然文化地标写真集，这些生成的效果图在各指标上实现了新的SOTA。

NeRF-W捕捉到了低维潜在嵌入空间的光和光度的后处理。在两个嵌入之间进行插值可以在不影响三维几何图形的情况下平滑地捕捉外观的变化。

外观的嵌入插值。

该模型可以将光线从基本三维场景几何体中分离出来，从而在光线发生变化时保持三维场景几何体的一致性。

几何一致性。

研究人员对NeRF-W合成设定中的个体增强进行了详细的控制变量研究，验证了每次增强都能达到预期的效果。在质量管理设定相似的前提下，NeRF-W在外观变化和瞬间遮挡物的挑战下实现的质量提升远远超过NeRF。

布兰登堡门。

圣心大教堂。

特雷喷泉。

NeRF-W改善了什么？

tify">利用一组稀疏的捕获图像合成场景的新视图是计算机视觉领域长期存在的挑战，也是许多 AR 和 VR 应用的基础。

传统技术已使用「structure-from-motion」或基于图像的渲染解决了这个问题。近来，由于神经渲染技术的出现，该领域又取得了重大的进展。

加州大学伯克利分校、谷歌等机构提出的神经辐射场（NeRF）方法在神经网络的权重范围内，隐式建模了辐射场和场景的密度。然后用直接体积渲染合成新视图，从而在一系列具有挑战性的场景中展示出前所未有的保真度。但是，这仅证明了 NeRF 在受控环境下运行良好：场景是在较短的时间范围内捕获，在此期间，场景中的光照条件保持恒定，而且所有内容都是静态的。

NeRF 的局限性在于，当场景内出现移动的物体或光照发生变化时，模型的性能会大大降低。这些缺陷限制了 NeRF 在自然环境中的应用。因为在自然环境中，图像的拍摄时间可能间隔数小时、数天甚至数年，而且场景中可能包含行人和汽车。

NeRF 假设世界在几何、物质和光度学上是静态的，即世界的密度和辐射（radiance）都是恒定的。因此，NeRF 要求在相同位置和方向拍摄的任何两张照片必须具有相同的像素强度。

但现实世界中的许多数据集都不符合该假设。例如，在著名旅游地标的大规模互联网照片集中，两位摄影师可能站在相同的位置并拍摄相同的地标，但是在这两张照片的时间间隔里，世界可能已经发生了巨大的变化：车、人会动，天气、气候也会变…… 即使在同一时间同一位置拍摄的两张照片也可能存在很大差异：曝光、色彩校正和色调映射可能都有所不同。

本文实验部分表明：将 NeRF 直接应用于室外照片集会导致严重的重影、过度平滑和其它瑕疵。

为了能够处理这些复杂的场景，来自谷歌的研究者提出了「NeRF-W」。

论文链接：https://arxiv.org/pdf/2008.02268.pdf

首先，研究者对每张图片的外观变化进行建模，包括曝光、光线、天气，并使用一个学到的低维潜在空间进行后处理。

根据 GLO（Generative Latent Optimization）模型的框架，研究者优化了每个输入图像的外观嵌入，从而让 NeRF-W 具备通过学习整个照片集的共享外观表征来解释图像之间光度与环境变化的灵活性。学习的外观潜在空间提供了对于输出渲染外观的控制，如下图 1 所示。

然后，研究者将场景建模为共享元素和基于图像元素的组合，从而能够在无监督的条件下将场景内容分解为静态组件和瞬态组件。这种分解实现了地标 3D 视图的高保真合成，而不会产生由输入图像中动态视觉内容所产生的伪影。本文所提出的方法将瞬态元素建模为一个二级体积辐射场（secondary volumetric radiance field）和一个数据相关的不确定场（datadependent uncertainty field），后者能够捕获变化的观测噪声，进一步减少瞬态物体对静态场景表征的影响。

具体方法

与 NeRF 类似，研究者从非结构化照片集