姚遥副教授团队就三维内容生成提出Direct2.5方法

三维内容生成是计算机视觉领域的热点课题，在CAD建模、影视制作、元宇宙等多个领域展现了巨大的应用潜力。针对这一课题，南京大学智能科学与技术学院姚遥老师团队提出了Direct2.5方法，实现了从文本快速且多样化的三维内容生成。该方法提出了一种多视角2.5D扩散模型用于表达复杂的三维结构化信息，同时拥有强大的泛化生成能力。而后，提出了一种新颖的基于可微光栅化的快速网格化方法，将生成的多视角2.5D图片融合为完整的三维模型。该方法摆脱了先前工作对于缓慢的SDS优化的依赖，突破性地将生成时间从先前所需的30分钟减少到仅需10秒，并实现多样化高真实内容生成。相关工作已被2024年国际模式识别与计算机视觉大会接受（CVPR 2024）。

Direct2.5三维几何与纹理贴图生成流程图

论文链接

https://arxiv.org/abs/2311.15980

导航

姚遥副教授团队就三维内容生成提出Direct2.5方法