ICML 2026 | 突破3DGS光度多义性瓶颈:北航/新国立提出AmbiSuR,重塑高保真3D几何重建

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
ICML 2026 | 突破3DGS光度多义性瓶颈:北航/新国立提出AmbiSuR,重塑高保真3D几何重建
6879点击    2026-05-19 14:57

近年来,3D 高斯泼溅(3D Gaussian Splatting, 3DGS)凭借其卓越的新视角合成能力和实时的渲染效率,极大地推动了神经渲染技术的发展。然而,当研究者试图直接从 3DGS 中提取精确的 3D 几何表面(Mesh 等)时,往往会面临严重的几何失真问题。正如论文所指出的,由于混合过程缺乏约束,模型极易出现过度重建(over-reconstruction)和恶性的几何重叠,生成由冗余基元构成的病态几何。模型往往是在利用这些错乱的冗余基元和复杂的遮挡关系来强行模拟视点相关的光影效果,而非恢复出明确的物理表面。 


导致这一现象的核心瓶颈,在于现实物理世界中普遍存在的光度多义性(Photometric Ambiguity)。在弱纹理、高光反射或视点遮挡等区域,仅凭多视角的光度一致性并不足以收敛出唯一确定的几何解,导致优化极易陷入 “几何过拟合”。现有方法大多依赖多次光线传播建模,但只作用于反射等部分区域;或全局引入深度等外部先验来进行正则化,这不仅容易引入先验模型本身的误差,还会削弱 3DGS 在纹理丰富区域的高频细节表达能力。 


ICML 2026 | 突破3DGS光度多义性瓶颈:北航/新国立提出AmbiSuR,重塑高保真3D几何重建


为了从根本上缓解这一痛点,北京航空航天大学与新加坡国立大学等学术机构的百晓 & Gim Hee Lee 研究团队在论文 ”Revisiting Photometric Ambiguity for Accurate Gaussian-Splatting Surface Reconstruction” 中提出了全新的 AmbiSuR 框架。该研究回归表征基础,深入剖析了 3DGS 内部的基元级多义性,并首次论证了球谐函数(Spherical Harmonics, SH)在高斯溅射中作为 “多义性自指示器” 的可行性与内在潜能。方法具有高度通用性,保持架构与先验类型无关。


该论文现已被 ICML 2026 接收,代码已开源。


本文第一作者为李嘉禾为北京航空航天大学计算机学院博士研究生,目前于新加坡国立大学 Gim Hee Lee 团队进行访问,主要研究方向为计算机三维视觉。通讯作者为北京航空航天大学计算机学院百晓教授和郑锦副教授。


ICML 2026 | 突破3DGS光度多义性瓶颈:北航/新国立提出AmbiSuR,重塑高保真3D几何重建


  • 论文标题:Revisiting Photometric Ambiguity for Accurate Gaussian-Splatting Surface Reconstruction
  • 论文链接:https://arxiv.org/abs/2605.12494
  • 项目主页:https://fictionarry.github.io/AmbiSuR-Proj/
  • 代码仓库:https://github.com/Fictionarry/AmbiSuR 


一、 溯源:3DGS 表面重建面临的表征与监督双重多义性


AmbiSuR 团队从基础原理出发,系统审视了 3DGS 在表面重建中遭遇的光度多义性,指出其来源于表征(Representation)和监督(Supervision)两个维度的缺陷与挑战:


ICML 2026 | 突破3DGS光度多义性瓶颈:北航/新国立提出AmbiSuR,重塑高保真3D几何重建

图 1:表征与监督多义性及方法流程


1. 表征层面的多义性(Representational Ambiguities)


通过对优化梯度的定量分析,团队指出了传统 3DGS 基元在几何成型时固有的两个结构性缺陷:


1)基元边缘多义性(Primitive Edge Ambiguity): 高斯基元的空间分布带有面积庞大但低不透明度的边缘。分析表明,高斯基元的核心区域主导了对光度误差的拟合,而广大的边缘区域只能接收到极弱的梯度反馈。这种结构性偏差导致基元为了拟合核心区域的误差,其边缘区域会产生不受控的过度膨胀,进而在弱约束区域引发严重的几何污染和粘连。


 2)光度混合多义性(Photometric Blending Ambiguity):3DGS 的渲染是基于 Alpha 混合(Alpha-blending)的像素级积分。对于反演明确的物理表面而言,单一像素的颜色监督是一个典型的不适定问题。优化器倾向于用冗余的病态基元层叠来拟合目标像素的颜色(即利用复杂的遮挡关系来模拟视点相关的效果),而不是重建出具有一致性光学属性的确切表面。      


2. 监督层面的多义性(Supervisory Ambiguities)


即使通过技术手段修复了表征层面的缺陷,3DGS 依然需要面对现实世界中不完美的监督信号。在真实场景中,由于反光、无纹理区域、视角覆盖不足或光照变化,多视角光度的一致性往往被打破。这些误导性的监督信号会迫使优化过程陷入妥协。 


此外,当面对冲突的光度约束时,3DGS 无法单纯依靠优化几何属性来降低损失,便会利用高自由度的视点相关参数(如球谐函数)来强行拟合这些残差。这导致几何误差或错误的外观被烘焙进了模型的颜色表达中,从而允许生成错误的几何结构


二、 核心解法:AmbiSuR 的双阶段干预机制


针对上述问题,AmbiSuR 提出了由内而外的两步解决方案: 


1. 表征层面:光度消歧模块(Photometric Disambiguation)


1)高斯基元截断(Gaussian Primitive Truncation):作者采用了一种直接的统计截断方法。利用标准差界定核心边界(论文中设定边界距离为 2 倍标准差),在计算渲染不透明度时,直接舍弃边缘区域,仅保留核心区域的贡献。这一操作从机制上切断了弱梯度带来的膨胀偏差,迫使基元保持紧凑。      


ICML 2026 | 突破3DGS光度多义性瓶颈:北航/新国立提出AmbiSuR,重塑高保真3D几何重建

图 2:高斯基元截断效果


2)光线 - 颜色一致性(Ray-Color Consistency):为打破颜色混合的不适定性,研究团队引入了基于射线的统计约束。他们计算了沿射线的发射颜色相对于混合期望颜色的加权方差。该损失项强制同一物理表面交点处的基元必须具备高度相似的光学属性,从而有效抑制了冗余伪影的生成。     


ICML 2026 | 突破3DGS光度多义性瓶颈:北航/新国立提出AmbiSuR,重塑高保真3D几何重建

图 3:光线 - 颜色一致性效果


2. 监督层面:球谐函数多义性指示(SH Ambiguity Indication)


这是本工作的一项关键洞察。作者指出,3DGS 中用于拟合视点相关(View-dependent)颜色的高阶球谐函数系数,天然具备量化光度多义性的能力。 


基于球面积分的特性,视点相关的颜色方差与高阶 SH 系数的平方和成正比。因此,作者定义了多义性指示器 I_SH,经推导可直接等价于高阶 SH 系数的模长。


在此基础上,AmbiSuR 设计了双端指示(Dual-End Indication)机制: 


1)上端指示(Upper Indicator): I_SH 指标处于顶部百分位(如前 5%)的基元,说明其在不同视角下受到了强烈冲突的约束,往往对应错误的几何突变或极具挑战的强反光区域。 


2)下端指示(Lower Indicator): 反直觉地是,该工作分析得出并由实验验证,在优化过程中,I_SH 处于底部百分位(如后 10%)通常也意味着该区域缺乏足够的光度监督信号,而通常并非理想的 non-Lambertian 表面(具体内容可由稀疏性推导得出,详见论文)。这使得下端指示同样成为有力的指示器。


ICML 2026 | 突破3DGS光度多义性瓶颈:北航/新国立提出AmbiSuR,重塑高保真3D几何重建

图 4:球谐函数多义性指示效果


通过动态锁定这些高风险的基元集合,AmbiSuR 构建了参数级细粒度的无定形局部正则化器(Amorphous Local Regularizer)。它仅针对这些多义性基元施加由深度图导出的法线先验进行约束,并在微调时冻结其缩放和不透明度参数。这种精细化的局部干预,在利用先验引导修正错误几何的同时,充分保护了 3DGS 在纹理清晰区域的高频细节。 


为了证明该框架卓越的适用性与通用性,研究团队在上述核心机制的基础上,提出了两种模型变体:1)标准 AmbiSuR: 引入多视角深度(Multi-view Depth)作为几何先验,并通过其导出的点云进行模型初始化,旨在探索表面重建精度的最强性能上限。2)单目变体 AmbiSuR-Mono: 结合极易获取且鲁棒的单目深度(Monocular Depth)先验,并采用传统的 SfM 稀疏点云进行初始化。 


实验证明 AmbiSuR 无论在拥有精确多视角几何信息的理想场景下,还是在仅能提取基础单目深度线索的受限环境中,都能展现出强大的兼容性与广泛的落地潜力。 


三、 实验验证:跨越多种表征的全面领先


研究团队在 DTU、Tanks and Temples (TnT) 以及 Mip-NeRF 360 多个标准数据集上对 AmbiSuR 进行了严格评估,结果证明其在精度、细节还原度以及鲁棒性上均表现卓越。


1. 定量评估


在表面重建的两大核心指标上,AmbiSuR 均取得了优异成绩:


DTU 数据集:无论是使用度量深度的标准版还是使用单目深度的 AmbiSuR-Mono,其在倒角距离(Chamfer Distance)上均达到了最优水平 0.46。它不仅超越了经典的隐式方法(如 Neuralangelo),也优于当前基于体素的最前沿方法 GeoSVR,证明了其在处理精细几何时的优越性。 


ICML 2026 | 突破3DGS光度多义性瓶颈:北航/新国立提出AmbiSuR,重塑高保真3D几何重建

图 5:DTU 数据集重建结果


Tanks and Temples 数据集:在包含真实世界复杂光照和大规模场景的 TnT 测试中,AmbiSuR 在 F1-score 指标上全面胜出(0.576 与 0.589)。即使面对尺度模糊的单目先验或精度有限的度量先验,AmbiSuR 依然能保持稳健的高精度重建,超越了带有深度先验的 MILo 和 GeoSVR 等强基线方法。 


ICML 2026 | 突破3DGS光度多义性瓶颈:北航/新国立提出AmbiSuR,重塑高保真3D几何重建

图 6:TnT 数据集重建结果


值得一提的是,方法在使用当前非 SOTA backbone PGSR 的情况下,指标性能实际追平甚至超越 GGGS、GaussianWrapping 等同期或更新方法,且方法本身高度架构无关,展现出强大性能潜力。


2. 定性对比 


通过对比重建的 Mesh 模型,可以清晰看到 AmbiSuR 的优势:消除几何崩塌:在反光和纹理稀疏区域,传统 3DGS 方法往往会生成混乱的过度重建表面来凑数,而 AmbiSuR 能够重建出平滑且符合物理逻辑的表面。细节高度还原:对于形状复杂的物体,AmbiSuR 展现了极强的细节捕捉能力,其提取的 Mesh 边缘锐利且表面纹理清晰,避免了其他方法常见的过度平滑或几何塌陷问题。现实世界重现:在无边界数据集重建方面,AmbiSuR 同样在 Mip-NeRF 360 数据集上表现良好。在未引入复杂光反射机制的情况下,对于反光及弱纹理表面等区域展现出强鲁棒性。


ICML 2026 | 突破3DGS光度多义性瓶颈:北航/新国立提出AmbiSuR,重塑高保真3D几何重建


ICML 2026 | 突破3DGS光度多义性瓶颈:北航/新国立提出AmbiSuR,重塑高保真3D几何重建

图 7:定性重建结果


ICML 2026 | 突破3DGS光度多义性瓶颈:北航/新国立提出AmbiSuR,重塑高保真3D几何重建


3. 消融研究


深入的消融实验验证了 AmbiSuR 核心设计的必要性:基元截断:实验显示,单纯引入基元截断策略,即使不进行重新训练,也能显著提升表面的几何清晰度。它有效解决了基元边缘过度膨胀导致的几何污染。光线 - 颜色一致性:该模块有效抑制了基元在混合时的属性发散。在透明和强反射表面的测试中,成功防止了模型通过产生过度重建表面来欺骗光度损失,从而恢复出正确的实体几何。球谐函数指示器:对比全局施加先验的平庸方案,基于 SH 指标的局部正则化方案在提升精度的同时,避免了对已重建良好区域的负面干扰。 


ICML 2026 | 突破3DGS光度多义性瓶颈:北航/新国立提出AmbiSuR,重塑高保真3D几何重建

图 8:消融实验定量结果


总结


AmbiSuR 在当前 3D 表面重建研究普遍着重于提升底层 Gaussian Splatting 及表面表征方式的背景下,重新向社区点明了探讨 “光度多义性 “这一根本性瓶颈的重要价值。作为解决方案,该工作选择向内挖掘 3DGS 自身表征的物理与统计学潜能。通过将球谐函数从单一的颜色拟合器拓展为 “多义性自指示器”,并辅以极简的基元截断与光线一致性约束,AmbiSuR 从根本上提出了一种自洽的内生消歧框架,无需复杂堆叠、高度兼容现有架构,不仅在各项标准基准上全面刷新了重建精度,也为未来提升神经渲染的几何稳健性与可解释性,提供了一条启发性的新路径。


文章来自于"机器之心",作者 "机器之心"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner