Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 重庆大学王洪星获国家专利权

重庆大学王洪星获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉重庆大学申请的专利一种基于场景蒙太奇的自监督视频场景边界检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117058593B

龙图腾网通过国家知识产权局官网在2025-07-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311107013.4,技术领域涉及:G06V20/40;该发明授权一种基于场景蒙太奇的自监督视频场景边界检测方法是由王洪星;陈路;杨平安;谭嘉崴设计研发完成,并于2023-08-30向国家知识产权局提交的专利申请。

一种基于场景蒙太奇的自监督视频场景边界检测方法在说明书摘要公布了:本发明涉及一种基于场景蒙太奇的自监督视频场景边界检测方法,通过从视频里选取两个随机位置处的视频片段,拼接两个片段合成一个语义转变点,作为伪视频场景边界,同时从余下镜头中再选取一处作为非视频场景边界,以此形成高质量的自监督信号,结合基于大数据集预先训练的视觉特征提取器,训练神经网络模型学习镜头间语义关系,检测场景边界。本发明方法有效地提高了生成的伪场景边界的质量,为场景边界检测模型提供了更多,以及更高质量的训练数据,显著提升了场景边界检测模型的准确性。

本发明授权一种基于场景蒙太奇的自监督视频场景边界检测方法在权利要求书中公布了:1.一种基于场景蒙太奇的自监督视频场景边界检测方法,其特征在于:包括如下步骤: S1:镜头序列的提取:获取一段输入长视频Svideo=[s1,...sN],获取其中的镜头,从镜头中进行关键帧的采样,N表示Svideo中镜头数量; S2:构建和训练视频场景蒙太奇网络模型VSM; S21:对于Svideo中的每个镜头si采用视觉编辑器编码为高维特征向量xi,Svideo=[s1,...,sN]被编码为镜头特征向量组成的序列Xvideo=[x1,...,xb,...,xN]; S22:通过随机参数γ,α,β来确定两个特征子序列的长度,以及它们的起始位置,通过拼接操作的合成的特征序列Xsyn,对应着合成的镜头序列Ssyn,其中,1≤γ≤n-1,1≤α≤N-γ+1和1≤β≤N-γ+1,n表示VSM生成的视频段中镜头的数量; 特征序列Xsyn和Ssyn合成的具体步骤如下: 选取一个随机的正整数γ,使得要截取的两个视频段中,一个包含γ个镜头,另一个包含n-γ个镜头,之后再选取两个随机的正整数α和β,作为要截取的两个视频段的起始镜头在长视频Svideo中的位置,从而可从Svideo截取出两个视频段作为两个伪场景,分别记作Sleft=[sα,sα+1…,sα+γ+1]和Sright=[sβ,sβ+1…,sβ+n-γ-1],两个伪场景共有n个镜头,将Sleft和Sright在时间维度上拼接在一起,形成一个合成的视频段Ssyn=[sα,…sα+γ+1,sβ,…,sβ+n-γ-1]: Ssyn=spliceSleft,Sright 其中,splice·表示在时间维度上进行拼接;α、β、γ都是不固定的随机数,每次合成视频段时都会重新选取这些随机数; 在从Xvideo=[x1,...,xN]中截取Ssyn对应的部分可得到Xsyn=[xα,...xα+γ+1,xβ,...,xβ+n-γ-1]; S23:通过S22的方法生成多个视频段为训练数据,以伪边界预测为代理任务,训练上下文编码器和场景边界判断模块,具体步骤如下: 将特征向量序列P=[p1,…,pn]拼接到Xsyn以补充每个镜头的位置信息,最后馈入上下文关系建模模块,以获取包含上下文信息的特征向量序列Rsyn=[rα,…rα+γ+1,rβ,…,rβ+n-γ-1]: Rsyn=ContextconcatP,Xsyn 其中,Context·是上下文关系建模模块,concat·是向量拼接操作; 对于视频段Ssyn,伪场景Sright的起始镜头sβ被看作正样本镜头,再从Ssyn中随机选择一个镜头si作为负样本镜头;最后,将正负样本对应的特征向量{rβ,ri}输入到场景边界判断模块中,通过最小化二分类交叉熵损失来预训练上下文编码器: 其中,hp·是场景边界判断模块,正则化项用于对抗过拟合,λ表示系数; S24:使用真实标注的场景边界信息进行对S25得到的预训练后的VSM进行微调,得到最终VSM; S3:检测,将待检测视频片段通过步骤S1获取镜头序列S’,后通过步骤S21得到对应特征序列X’,将X’输入最终VSM,输出序列中间镜头为场景边界的置信度。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆大学,其通讯地址为:400044 重庆市沙坪坝区沙正街174号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。