Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 合肥工业大学王飞获国家专利权

合肥工业大学王飞获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉合肥工业大学申请的专利一种基于Transformer网络的视频运动放大方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116527826B

龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310481761.2,技术领域涉及:H04N5/14;该发明授权一种基于Transformer网络的视频运动放大方法是由王飞;郭丹;李坤;汪萌设计研发完成,并于2023-04-28向国家知识产权局提交的专利申请。

一种基于Transformer网络的视频运动放大方法在说明书摘要公布了:本发明公开了一种基于Transformer网络的视频运动放大方法,其步骤包括:1、利用所提出的运动表示编码器提取运动表示;2、计算运动表示的差值以获取运动变化;3、使用所提出的运动放大转换模块执行非线性放大,得到放大运动表示;4、将放大运动表示与查询帧的运动表示的特征融合;5、通过所提出的多重细化解码器得到精细的放大融合特征;6、重建高质量的运动放大图像。本发明能快速准确地放大与可视化视频中人眼难以观测的微小运动,基于所提出的Transformer网络可以有效地抑制运动放大视频中存在的振铃伪影、噪声、运动模糊等问题,从而能生成高质量的运动放大视频。

本发明授权一种基于Transformer网络的视频运动放大方法在权利要求书中公布了:1.一种基于Transformer网络的视频运动放大方法,其特征是按如下步骤进行: 步骤1、获取包含微小运动变化的连续帧图像,并将第一帧图像作为参考帧,记为;将第二帧图像为查询帧,记为;对查询帧进行颜色扰动后得到的颜色扰动的查询帧记为;将参考帧和查询帧对应的真实放大帧记为;将真实放大帧的放大因子记为,其中,表示实数域,表示图像的高度,表示图像的宽度,3表示图像的通道数; 步骤2、构建Transformer网络,包括:运动表示编码器、运动放大转换模块、多重细化解码器; 定义当前训练次数为,并初始化,令第次训练时Transformer网络的参数为; 步骤3、所述运动表示编码器利用式1分别对参考帧、查询帧和颜色扰动的查询帧进行特征提取,相应得到第次训练时的参考特征、查询特征和扰动特征: 1 式1中,表示第次训练时卷积核尺寸为的卷积操作,表示特征的维度; 步骤4、所述运动表示编码器利用式2对于参考特征进行处理,得到第次训练时的查询向量、键向量和值向量: 2 式2中,表示第次训练时的Pointwise卷积操作,表示第次训练时的Depthwise卷积操作;表示层归一化操作,表示平铺化操作; 将、和分别沿着特征的通道维度分成个头,从而得到、和;其中,表示第次训练时第注意力头的查询向量,表示第次训练时第注意力头的键向量,表示第次训练时第注意力头的值向量; 步骤5、所述运动表示编码器利用式3计算第次训练时第注意力头的转置注意力图: 3 式3中,表示激活函数,表示转置操作,表示第次训练时的待学习的温度参数; 步骤6、所述运动表示编码器利用式4计算第次训练时第注意力头的、和之间的互协方差注意力: 4 步骤7、所述运动表示编码器利用式5对n个注意力头的互协方差注意力进行处理,得到第次训练时的特征映射: 5 式5中,表示个注意力头的拼接操作; 步骤8、所述运动表示编码器利用式6特征映射进行处理,生成第次训练时参考帧的运动表示: 6 式6中,表示双路径点积的门控机制,并有: 7 式7中,表示特征维度的扩展因子,表示非线性激活函数;、分别表示第次训练时在第1条路径下Pointwise卷积操作与Depthwise卷积操作,、分别表示第次训练时在第2条路径下Pointwise卷积操作与Depthwise卷积操作;表示哈达玛积; 步骤9、按照步骤4-步骤8的过程,并以运动表示编码器共享权值的方式,分别对查询特征和扰动特征进行处理,相应得到查询帧的运动表示与颜色扰动的查询帧的运动表示; 步骤10、所述运动放大转换模块利用式8计算第次训练时两帧运动表示与的差值: 8 步骤11、所述运动放大转换模块利用式9计算第次训练时差值的放大运动表示: 9 步骤12、所述多重细化解码器对所述第次训练时的放大运动表示与查询帧的运动表示沿通道维度进行特征拼接,从而得到第次训练时的放大融合特征; 步骤13、所述多重细化解码器通过堆叠个Transformer层的方式逐层对所述放大融合特征进行精细化,得到精细的放大融合特征; 步骤14、所述多重细化解码器利用式10对精细的放大融合特征进行重建,得到第次训练时高质量的放大帧: 10 式10中,表示第次训练时亚像素精度的上采样操作; 步骤15、利用式11计算第次训练时Transformer网络的误差: 11 式11中,是平衡两种损失误差的超参数,表示Charbonnier损失函数; 步骤16、判断所述第次训练时的误差是否收敛;若收敛,则表示所述第次训练时Transformer网络的参数为最优参数,并以最优参数所对应的Transformer网络作为最终用于生成视频运动放大的模型;相反,所述Transformer网络继续执行第次梯度反向传播,并更新Transformer网络的参数,并得到第次训练时Transformer网络的参数后,执行步骤17; 步骤17、将t+1赋值给t,返回步骤3顺序执行。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥工业大学,其通讯地址为:230009 安徽省合肥市包河区屯溪路193号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。