华中科技大学孙慧强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华中科技大学申请的专利基于自注意力机制的单目输入动态场景新视图合成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115565039B 。
龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211142903.4,技术领域涉及:G06V10/80;该发明授权基于自注意力机制的单目输入动态场景新视图合成方法是由孙慧强;曹治国;李星毅;鲜可;王一然;申立奥设计研发完成,并于2022-09-20向国家知识产权局提交的专利申请。
本基于自注意力机制的单目输入动态场景新视图合成方法在说明书摘要公布了:本发明公开了一种基于自注意力机制的单目输入动态场景新视图合成方法,提出了一种动态场景新视图合成新范式,即利用自注意力机制表达动态场景在时间维度上的内在关联,从而利用时间全局信息来完成动态场景的新视点合成,可以得到真实可靠的新视图合成结果,同时去除了光流与场景流的约束,简化模型的训练,并降低模型的内存开销与训练时间;去除了场景流的预测以及光流信息的先验,在得到可靠的新视图合成结果的同时简化了模型的优化,同时降低了内存开销。
本发明授权基于自注意力机制的单目输入动态场景新视图合成方法在权利要求书中公布了:1.一种基于自注意力机制的单目输入动态场景新视图合成方法,其特征在于,包括: 训练阶段: 以动态场景的单目视频序列作为训练集,对合成模型进行训练;其中,以所述合成模型生成的RGB图像及深度图像与真实的RGB图像及深度图像的均方差为损失函数;所述合成模型包括特征提取网络、位置编码模块、自注意力编码器、注意力解码器及视图生成模块: 其中,所述特征提取网络用于对单目视频序列进行特征提取得到特征图序列;所述位置编码模块用于将各特征图与与其大小相同且带有位置信息的3D张量进行相加,得到引入位置信息的特征图序列; 所述自注意力编码器用于对所述引入位置信息的特征图序列进行自注意力操作,得到引入全局信息的特征图序列;所述注意力解码器用于以将所述引入位置信息的特征图序列及插帧特征图序列进行自注意力操作后得到的结果作为query,以对所述引入全局信息的特征图序列进行卷积处理后的结果作为key和value,进行注意力操作,得到输出特征图序列; 所述视图生成模块用于将时间信息、场景空间点的坐标、视图方向输入至动态模型,将场景空间点的坐标、视图方向输入至静态模型,并将所述动态模型及静态模型的输出结果进行融合、渲染,得到RGB图像及深度图像;其中,以将所述输出特征图序列进行全局池化得到的特征向量作为时间信息;所述空间点从对所述单目视频序列的每一个视图方向的相机光线上选取;所述视图方向从所述单目视频序列对应的相机参数中得到; 应用阶段: 将特定视图方向、场景空间点坐标及特定时间信息输入至所述动态模型,将特定视图方向、及场景空间点坐标输入至所述静态模型,将所述动态模型及静态模型的输出结果进行融合、渲染,得到所述特定视图方向及特定时间下的RGB图像;其中,所述特定时间信息为将特定时间下的插帧特征图输入至注意力解码器进行注意力操作后得到的结果进行全局池化得到的特征向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华中科技大学,其通讯地址为:430074 湖北省武汉市洪山区珞喻路1037号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励