Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京理工大学王瑜彤获国家专利权

北京理工大学王瑜彤获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京理工大学申请的专利一种自监督方式的视频摘要方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117150076B

龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311104554.1,技术领域涉及:G06F16/738;该发明授权一种自监督方式的视频摘要方法是由王瑜彤;罗迪新;许洪腾设计研发完成,并于2023-08-30向国家知识产权局提交的专利申请。

一种自监督方式的视频摘要方法在说明书摘要公布了:本发明公开了一种自监督方式的视频摘要方法。本发明首先根据视频数据生成了一系列文本,每一个文本对应于视频的一个片段,之后利用逆最优传输问题实现了视频帧与文本描述之间的匹配,完成视频表征和文本表征的对齐。然后基于得到的最优传输方案,提出了一种生成帧级伪重要性分数的方法,该伪分数由两类子分数组成:对齐分数和表征分数。最后通过利用得到的伪分数作为监督信息,对关键帧选择器进行训练。测试时,基于关键帧选择器输出的帧级重要性分数,可以选择出关键帧来构建视频摘要。

本发明授权一种自监督方式的视频摘要方法在权利要求书中公布了:1.一种自监督方式的视频摘要方法,其特征在于,包括: 步骤1,构建训练集,所述训练集中包含N个视频;针对训练集中的每一条视频,将其分成多个时长相同的视频片段,并生成各视频片段的文本,得到“视频-文本”对的集合其中,表示第n个视频内有In个视频帧;表示第n个视频对应的文本内共有Jn个文本,分别对应于视频的Jn个视频片段; 步骤2,针对集合D中的各“视频-文本”对,提取视频的视觉表征V以及文本的文本表征W; 步骤3,对中的各“视频-文本”对的视觉表征与文本表征进行对齐,具体为: 将对齐问题转化为逆最优传输问题,即通过学习一个文本投影模块f来实现从文本表征到视觉表征的投影,并得到一组最优传输方案 其中,Tn表示对于第n个视频,其所在视频帧集合与文本集合之间的最优传输矩阵,f表示文本域到视觉域的文本投影模块, d为欧几里得距离,fwn,j为将文本表征wn,j通过文本投影模块后得到的投影后的文本表征;“A,B”表示矩阵A和矩阵B之间的点积;τ为超参数,τ0;KL散度正则项用于衡量两个概率分布函数PX和QX之间的距离,定义为 为长度分别为Jn和In、值全为1的均匀分布;为第n个视频中与第j个文本相对应的视频片段的视觉表征; 其中, 是投影后的文本表征之间的距离矩阵,采用的是欧几里得距离矩阵;fWn是经文本投影模块投影后得到的文本表征的集合;是一个形状为J×J的边缘限制矩阵,矩阵中对角线元素的值为0,其余元素值为1; 步骤4,根据步骤3得到的最优传输方案生成视频的帧级伪重要性分数;所述帧级伪重要性分数为对齐分数和表征分数的加权和; 其中,对齐分数为:对于一个共有I帧的视频和该视频生成的J个文本,其最优传输方案记作则第i个视频帧的对齐分数为:sa,i=maxj∈{1,…,J}sij,sij为第j个文本与第i个视频帧之间的相对重要性,其中,uj为第j个文本投影后的文本表征,vi为第i个视频帧的视觉表征, 表征分数为:对于第i个视频帧,以该帧为中心,周围共K′个相邻帧,定义相邻帧集合为则第i个视频帧的表征分数为: 步骤5,构建关键帧选择器g,所述关键帧选择器g以视频的视觉表征为输入,以各视频帧的帧级重要性分数为输出;以步骤4生成的训练集中各视频的帧级伪重要性分数为伪标签,对关键帧选择器g进行训练,得到训练好的关键帧选择器g; 步骤6,对待提取摘要的视频,首先将视频分为多个视频片段,提取视觉表征;然后将视觉表征输入训练好的关键帧选择器g得到各视频帧的帧级重要性分数;最后利用01背包算法来挑选出关键帧,组成视频摘要。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。