东北大学侯英鹂获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东北大学申请的专利一种融合动态感知的扩散模型视频生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120529150B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511022217.7,技术领域涉及:H04N21/854;该发明授权一种融合动态感知的扩散模型视频生成方法是由侯英鹂;朱志良;张伟;于海设计研发完成,并于2025-07-24向国家知识产权局提交的专利申请。
本一种融合动态感知的扩散模型视频生成方法在说明书摘要公布了:本发明提供了一种融合动态感知的扩散模型视频生成方法,涉及视频生成技术领域,本发明提出了一种全局‑局部耦合模块,包含卷积分支与卷积注意力模块,其中卷积注意力模块通过通道注意力权重实现对卷积特征的动态调制,从而有效地融合局部空间信息和全局时空信息。该结构有效克服了传统扩散模型感受野过大、容易导致过拟合或“记忆”视频数据的缺陷,大幅提高了生成视频内容的多样性与泛化能力。本发明采用单尺度训练策略,仅在一个分辨率尺度上进行训练,消除了传统多尺度金字塔结构视频生成方法中容易出现的细节误差累积问题,有效避免了多尺度模型逐级训练带来的视觉伪影和不自然的细节失真现象,提高了生成视频的视觉真实感和质量。
本发明授权一种融合动态感知的扩散模型视频生成方法在权利要求书中公布了:1.一种融合动态感知的扩散模型视频生成方法,其特征在于,包括: 步骤1:获取参考视频,通过预设帧率对所述参考视频进行解码,得到连续视频帧序列,其中,N表示连续视频帧序列的总帧数,表示第N帧图像; 步骤2:对连续视频帧序列中的每一帧图像进行裁剪和噪声添加,得到带噪图像,进而得到带噪图像序列,其中,表示第N帧图像对应的带噪图像; 步骤3:将带噪图像序列输入单尺度扩散模型中,得到预测特征图序列,其中,表示第N个预测特征图,θ表示单尺度扩散模型的参数向量,所述单尺度扩散模型包括多个全局-局部耦合模块,所述全局-局部耦合模块包括ResNet卷积分支和卷积注意力模块分支; 步骤4:基于连续视频帧序列和预测特征图序列,计算联合损失函数值; 步骤5:基于联合损失函数值,通过反向传播对单尺度扩散模型中ResNet卷积分支的权重矩阵和卷积注意力模块分支的权重矩阵进行更新,进而对单尺度扩散模型继续多次更新,得到训练完成的单尺度扩散模型; 步骤6:将待生成视频进行解码、裁剪和噪声添加,并输入训练完成的单尺度扩散模型,得到待生成视频的预测特征图序列; 步骤7:基于训练完成的单尺度扩散模型,对预测特征图序列进行视频生成和推理,得到连续的预测帧序列、优化帧序列和平滑过渡帧序列; 步骤7.1:对训练完成的单尺度扩散模型进行改进,得到第一改进模型和第二改进模型; 具体的,针对训练完成的单尺度扩散模型中的每个全局-局部耦合模块,在全局平均池化之后卷积注意力模块分支之前,添加第一时序处理,具体的,添加扩散时间嵌入函数和帧间差分嵌入函数,得到第一改进模型;在全局平均池化之后卷积注意力模块分支之前,添加第二时序处理,具体的,添加扩散时间嵌入函数,得到第二个改进模型; 步骤7.2:将待生成视频的预测特征图序列输入第一改进模型中,得到连续的预测帧序列; 具体的,在第一改进模型的全局-局部耦合模块中,将待生成视频的预测特征图序列依次经过ResNet卷积分支、全局平均池化、扩散时间嵌入函数和帧间差分嵌入函数、卷积注意力模块分支,并将输出的特征图输入到第一改进模型的下一个全局-局部耦合模块中,直到第一改进模型的最后一个全局-局部耦合模块输出连续的预测帧序列; 步骤7.3:将连续的预测帧序列输入第二改进模型中,得到优化帧序列; 具体的,在第二改进模型的全局-局部耦合模块中,将连续的预测帧序列依次经过ResNet卷积分支、扩散时间嵌入函数、卷积注意力模块分支,并将输出的特征图输入到第二改进模型的下一个全局-局部耦合模块中,在第二改进模型的最后一个全局-局部耦合模块输出优化帧序列; 步骤7.4:在连续视频帧序列中,获取优化帧序列中每两帧图像的中间帧图像,进而得到新的视频帧序列,将新的视频帧序列输入第二改进模型中,得到平滑过渡帧序列。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东北大学,其通讯地址为:110819 辽宁省沈阳市和平区文化路三号巷11号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励