三维内容生成是计算机视觉领域的热点课题,在CAD建模、影视制作、元宇宙等多个领域展现了巨大的应用潜力。针对这一课题,南京大学智能科学与技术学院姚遥老师团队提出了Direct2.5方法,实现了从文本快速且多样化的三维内容生成。该方法提出了一种多视角2.5D扩散模型用于表达复杂的三维结构化信息,同时拥有强大的泛化生成能力。而后,提出了一种新颖的基于可微光栅化的快速网格化方法,将生成的多视角2.5D图片融合为完整的三维模型。该方法摆脱了先前工作对于缓慢的SDS优化的依赖,突破性地将生成时间从先前所需的30分钟减少到仅需10秒,并实现多样化高真实内容生成。相关工作已被2024年国际模式识别与计算机视觉大会接受(CVPR 2024)。

Direct2.5三维几何与纹理贴图生成流程图
论文链接
https://arxiv.org/abs/2311.15980
上一篇:下一篇:









