SemanticHuman-HD是南京大学智能科学与技术学院易子立副教授参与的一项研究成果,它提出了一种新颖的3D人体图像合成方法,该方法能够在高分辨率下实现对人体图像的语义解耦。这项技术通过两阶段的训练过程,首先在较低分辨率下生成包含人体、深度图和语义掩码的图像,然后在第二阶段应用3D感知超分辨率模块,显著提升图像质量至1024×1024分辨率。SemanticHuman-HD的独特之处在于其能够独立控制和生成人体的不同语义部分,如身体、上衣、外衣、裤子、鞋子和配饰等。
该方法利用深度图和语义掩码作为引导,优化了体积渲染过程中的采样点数量,有效降低了计算成本。SemanticHuman-HD不仅在技术上实现了创新,还在应用层面提供了广泛的潜力,包括3D服装生成、语义感知虚拟试穿、可控图像合成和跨领域图像合成等。通过消融研究,论文验证了所提出方法的各个组成部分的有效性,并在定量和定性评估中展示了其相较于现有最先进方法的优越性能。SemanticHuman-HD的研究成果为人工智能领域中的人体图像合成技术开辟了新的可能性。
论文链接:https://arxiv.org/abs/2403.10166
上一篇:下一篇: