腾讯混元开源Hunyuan3D-1.0:首个同时支持文生和图生的3D开源大模型
11月5日消息,腾讯混元今日开源了Hunyuan3D-1.0大模型,官方称这是首个同时支持文生和图生的3D开源大模型。模型采用两阶段生成方法,官方表示在保证质量和可控的基础上,10秒即可生成3D资产:
第一阶段,团队采用了一种多视角扩散模型,轻量版模型能够在大约4秒内生成多视角图像。这些多视角图像从不同的视角捕捉了3D资产的丰富的纹理和几何先验,将任务从单视角重建松弛到多视角重建
第二阶段,团队引入了一种前馈重建模型,利用上一阶段生成的多视角图像。该模型能够在大约3秒内快速而准确地重建3D资产。重建模型学习处理多视角扩散引入的噪声和不一致性,并利用条件图像中的可用信息高效恢复3D结构
最终该模型可以实现输入任意单视角实现三维生成
