Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 深圳大学张琦获国家专利权

深圳大学张琦获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉深圳大学申请的专利基于结构化提示的全景图片的生成方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120852576B

龙图腾网通过国家知识产权局官网在2026-03-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511377063.3,技术领域涉及:G06T11/00;该发明授权基于结构化提示的全景图片的生成方法、装置、设备及介质是由张琦;王延逸凡;黄惠设计研发完成,并于2025-09-25向国家知识产权局提交的专利申请。

基于结构化提示的全景图片的生成方法、装置、设备及介质在说明书摘要公布了:本申请涉及计算机视觉技术领域,特别涉及一种基于结构化提示的全景图片的生成方法、装置、设备及介质。所述方法包括构建训练数据集;基于训练数据集对预训练生成模型进行训练,以得到经过训练的全景图片生成模型;获取单视角图像和目标提示信息,通过全景图片生成模型基于单视角图像和目标提示信息生成全景图片。本申请通过引入局部结构提示和全局结构提示来提供街景中物体的结构特征,通过全景分支整合全局的全景信息以保证视角间的整体一致性,通过全景对齐模块对多视角图像进行全局一致性优化,通过多视角分支结合局部多视图信息以捕捉细节和局部结构,有效解决了户外场景的全景图片生成中的物体结构复杂和尺度不一致的问题。

本发明授权基于结构化提示的全景图片的生成方法、装置、设备及介质在权利要求书中公布了:1.一种基于结构化提示的全景图片的生成方法,其特征在于,所述的基于结构化提示的全景图片的生成方法具体包括: 构建训练数据集,其中,所述训练数据集中的训练数据均包括单视角图像、全景图像和提示信息,提示信息包括至少一个单视角描述信息和或全景条件图像,所述全景条件图像用于提供结构提示; 基于所述训练数据集对预训练生成模型进行训练,以得到经过训练的全景图片生成模型,所述全景图片生成模型包括条件构建模块、多视角分支、全景分支和全景对齐模块; 获取单视角图像和目标提示信息,通过所述全景图片生成模型基于所述单视角图像和所述目标提示信息生成全景图片,其中,目标提示信息包括至少一个单视角描述信息和或全景条件图像; 所述全景图片生成模型包括条件构建模块、多视角分支、全景分支和全景对齐模块;所述通过所述全景图片生成模型基于所述单视角图像和所述目标提示信息生成全景图片具体包括: 通过所述条件构建模块基于所述目标提示信息构建局部条件和全局条件; 通过所述全景分支基于所述单视角图像和所述全局条件确定全景去噪特征图; 通过所述多视角分支基于所述单视角图像和所述局部条件确定多视角去噪特征图; 通过所述全景对齐模块基于所述全景去噪特征图对所述多视角去噪特征图进行更新,以得到更新多视角去噪特征图; 通过所述多视角分支基于所述更新多视角去噪特征图确定多视角图片,并将所述多视角图片进行拼接以得到全景图片; 所述全局条件包括全局文本提示和全局结构提示;所述通过所述全景分支基于所述单视角图像和所述全局条件确定全景去噪特征图具体包括: 通过所述全景分支将所述单视角图像的分辨率扩展到全景图像分辨率以得到初始全景图像,并对所述初始全景图像进行前向扩散加噪以得到全景噪声图; 通过所述全景分支基于所述全局文本提示对所述全景噪声图进行去噪,以得到初始全局去噪图像; 通过所述全景分支将所述全局结构提示和所述初始全局去噪图像进行交叉注意力学习,以得到全景去噪特征图; 所述局部条件包括局部文本提示和局部结构提示;所述通过所述多视角分支基于所述单视角图像和所述局部条件确定多视角去噪特征图具体包括: 通过所述多视角分支基于所述单视角图像生成多视角图像,并对所述多视角图像进行前向扩散加噪,以得到多视角噪声图; 通过所述多视角分支基于所述局部文本提示对所述多视角噪声图进行去噪,以得到初始多视角去噪图像; 通过所述多视角分支将所述局部结构提示和所述初始多视角去噪图像进行交叉注意力学习,以得到多视角去噪特征图; 所述通过所述全景对齐模块基于所述全景去噪特征图对所述多视角去噪特征图进行更新,以得到更新多视角去噪特征图具体包括: 对于多视角去噪特征图中的每个源像素,在全景去噪特征图中为所述源像素选取目标采样区域; 基于所述多视角去噪特征图构建查询向量,并基于所述目标采样区域构建值向量和键向量; 基于所述查询向量和值向量和键向量通过注意力机制构建第一多视角去噪特征图,并基于掩码注意力机制构建第二多视角去噪特征图; 基于第一多视角去噪特征图和第二多视角去噪特征图确定更新多视角去噪特征图。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳大学,其通讯地址为:518060 广东省深圳市南山区粤海街道南海大道3688号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。