石家庄铁道大学张云佐获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉石家庄铁道大学申请的专利基于全局多尺度编码与局部稀疏注意力的视频摘要生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120296202B 。
龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510772225.7,技术领域涉及:G06F16/738;该发明授权基于全局多尺度编码与局部稀疏注意力的视频摘要生成方法是由张云佐;肖遥舸;赵旭静;赵辉;封筠;张志国设计研发完成,并于2025-06-11向国家知识产权局提交的专利申请。
本基于全局多尺度编码与局部稀疏注意力的视频摘要生成方法在说明书摘要公布了:本发明公开了一种基于全局多尺度编码与局部稀疏注意力的视频摘要生成方法,属于计算机视觉技术领域。所述方法包括:读取输入视频,提取输入视频的帧级特征向量;构造视频摘要生成模型,将帧级特征向量输入视频摘要模型;将全局多尺度编码和局部稀疏注意力模块的输出进行自适应融合,生成融合特征;融合特征经回归网络输出帧重要性分数,选出代表性帧,生成视频摘要。本发明所提视频摘要方法通过结合全局多尺度编码与局部稀疏注意力机制,能够精确识别视频中的关键片段,显著提升视频浏览效率和用户体验。实验在基准数据集SumMe和TVSum上进行,实验结果充分证明了该方法的有效性。
本发明授权基于全局多尺度编码与局部稀疏注意力的视频摘要生成方法在权利要求书中公布了:1.一种基于全局多尺度编码与局部稀疏注意力的视频摘要生成方法,其特征在于,包括以下步骤: S1:读取输入视频,提取视频帧的帧级特征向量; S2:将帧级特征向量输入视频摘要生成模型,预测帧级重要性分数,所述视频摘要生成模型包括: 视频特征优化器:所述视频特征优化器接收帧级特征向量,通过执行全局平均池化生成全局上下文向量,将所述全局上下文向量与所述帧级特征向量进行注意力加权,输出优化特征序列; 全局多尺度编码模块:所述全局多尺度编码模块接收优化特征序列,通过多头注意力机制提取全局特征表示,并通过多尺度深度可分离卷积操作提取局部特征表示,通过融合所述全局特征表示和所述局部特征表示来提取视频中的全局语义信息; 局部块对角稀疏注意力模块:所述全局多尺度编码模块的输出作为所述局部块对角稀疏注意力模块的输入,所述局部块对角稀疏注意力模块将自注意力矩阵稀疏化为块对角结构,通过拼接注意力加权特征、帧级独特性特征及块间多样性特征建模局部依赖关系; S3:将所述全局多尺度编码模块的输出和局部块对角稀疏注意力模块的输出进行自适应加权融合,生成融合特征表示; S4:将所述融合特征表示输入回归网络,输出帧级重要性分数,选择出最具代表性的帧,并生成最终的视频摘要。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人石家庄铁道大学,其通讯地址为:050043 河北省石家庄市长安区北二环东路17号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。