三维高斯泼溅3DGS技术原理详解（附：工程化训练流程说明）

作者：hangge | 2026-04-01 09:30

在三维重建与新视角合成中，长期存在“高质量难以兼顾实时性”的矛盾：传统多视几何渲染高效，但在复杂光照与细节表达上受限；以 NeRF 为代表的神经隐式方法画质出色，却训练和渲染成本高，难以实时交互。

2023 年提出的 3D Gaussian Splatting（3DGS）为此提供了新思路。它以大量半透明彩色高斯体直接表示场景，在保持高视觉质量的同时实现了高效、实时渲染，使基于照片的高保真三维重建首次能够在桌面级硬件上流畅交互。下面我将详细介绍 3DGS 相关技术原理以及基本的训练流程。

（1）3DGS 是一种把场景用大量三维高斯元（3D Gaussians）来显式表示，并通过将这些三维高斯投影为二维椭圆斑点（splat）来进行快速可微渲染的技术。

（2）3DGS 把体渲染（如 NeRF 那类隐式体渲染）和显式几何（点云 / mesh）之间做了一种折中：既保留了对连续体（连续光场/不规则表面）的好拟合能力，又能用光栅化式的 splatting 在 GPU 上实时渲染，从而实现比传统 NeRF 快很多的训练/渲染效率和交互速度。

（1）相较于 NeRF，3DGS 存在如下优势：

（2）相较于 NeRF，3DGS 存在如下不足和局限：

（1）稀疏点云初始化 (Structure from Motion)

（2）将点变为“高斯椭球” (3D Gaussians）

（3）泼溅投射与快速光栅化 (Splatting & Rasterization)

分块光栅化： 3DGS 使用了一种极其高效的 GPU 算法。它将屏幕分成很多 16 * 16 的小块（Tiles），只渲染对该区域有贡献的高斯球。这使得它的渲染速度能轻松达到 100+ FPS。

（4）自适应控制 (Optimization & Densification)

（1）先准备一组从不同角度拍摄的照片，这些照片是场景的“视觉依据”，用于后续的训练。注意如果三个要点：

（2）3DGS 本身不会估计相机位姿，因此需要先用 COLMAP 对这些图像做结构重建（SfM + MVS）：

（3）运行训练脚本，3DGS 程序会自动开始在稀疏点云的基础上生成高斯球并进行优化。具体过程如下：

（4）最后训练完成后，就可以得到支持旋转浏览的高斯点云（成千上万个彩色椭球体）。我们可以使用专门的 3DGS 查看器来查看 .ply 格式的 3D 高斯模型文件。

提示：一个精细的场景（3 万次迭代）产生的 point_cloud.ply 通常在几百 MB 到 1GB 之间。如果发现文件只有几 MB，那说明训练可能还没开始或参数设置有误。

其他