华为技术有限公司卢冠松获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华为技术有限公司申请的专利一种物体生成的方法、装置及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116228959B 。
龙图腾网通过国家知识产权局官网在2026-01-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211515098.5,技术领域涉及:G06T17/00;该发明授权一种物体生成的方法、装置及系统是由卢冠松;徐航;韩建华;张维设计研发完成,并于2022-11-30向国家知识产权局提交的专利申请。
本一种物体生成的方法、装置及系统在说明书摘要公布了:本申请提供一种物体生成的方法包括:将文本输入二维图片生成模型,输出物体的多个视角的二维图片;文本用于描述物体的特征,特征包括物体类别、颜色和形状;二维图片生成模型用于根据文本生成多个视角的二维图片;视角为物体呈现的空间角度;计算多个视角的二维图片与文本的相似度的值,根据相似度的值得到多个视角增强的二维图片;将多个视角增强的二维图片输入三维物体生成模型,三维物体生成模型基于多个视角增强的二维图片渲染出其他角度的二维图片,输出符合文本描述的三维物体。本申请采用二维图片生成模型根据文本生成对应物体的多个视角的二维图片,再采用三维物体生成模型根据多个视角的二维图片生成对应3D物体,能够提高生成的3D物体的质量以及加快3D物体生成的速度。
本发明授权一种物体生成的方法、装置及系统在权利要求书中公布了:1.一种物体生成的方法,其特征在于,所述方法包括: 将文本输入二维图片生成模型,输出物体的多个视角的二维图片;所述文本用于描述所述物体的特征,所述特征包括所述物体类别、颜色和形状;所述二维图片生成模型用于根据所述文本生成多个视角的二维图片;所述二维图片生成模型包括文本标记器、Transformer结构和第一图像标记器;所述二维图片生成模型的输入还包括相机参数,所述相机参数用于指示生成二维图片的视角;所述视角为所述物体呈现的空间角度; 计算所述多个视角的二维图片与所述文本的相似度的值,根据所述相似度的值得到多个视角增强的二维图片,包括: 计算所述多个视角的二维图片中每个视角的m张二维图片与所述文本之间的语义相似度,得到m个相似度的值;对所述m个相似度的值排序,确定其中相似度的值符合阈值要求的s个二维图片作为每个视角的增强的二维图片,其中,ms; 将所述多个视角增强的二维图片输入三维物体生成模型,所述三维物体生成模型基于所述多个视角增强的二维图片渲染处其他角度的二维图片,输出符合所述文本描述的三维物体,包括: 将所述多个视角增强的二维图片输入pixelNeRF网络,所述pixelNeRF网络为三维物体生成模型;沿着所述多个视角中每个视角的目标射线d的查询点x,通过投影和插值从所述每个视角增强的二维图片中提取相应的图像特征,然后将每个所述图像特征与空间坐标一起输入NeRF网络,对输出的RGB和密度值进行体积渲染,得到所述物体的NERF模型;所述物体的NERF模型为隐性模型; 基于所述物体的NERF模型渲染出所述多个视角之外的其他视角的图像,得到符合所述文本描述的三维物体模型;所述三维物体模型为物体的网格mesh模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华为技术有限公司,其通讯地址为:518129 广东省深圳市龙岗区坂田华为总部办公楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励