武汉理工大学陈亚雄获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉武汉理工大学申请的专利基于深度学习的大规模短视频检索方法、系统及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115357754B 。
龙图腾网通过国家知识产权局官网在2025-07-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210811333.7,技术领域涉及:G06F16/78;该发明授权基于深度学习的大规模短视频检索方法、系统及设备是由陈亚雄;杨锴;黄景灏;周中舟;熊盛武设计研发完成,并于2022-07-11向国家知识产权局提交的专利申请。
本基于深度学习的大规模短视频检索方法、系统及设备在说明书摘要公布了:本发明公开了一种基于深度学习的大规模短视频检索方法、系统及设备,本发明的方法首先针对待检索短视频,进行关键帧提取与视频标准化处理;然后将处理后的短视频输入短视频语义特征提取网络,利用相似度计算得到相似的T个视频;其中,T为预设值;本发明设计了一种新的设计了一种新的短视频语义特征提取网络来提取三维视频数据在二维空间中的数据表示。并且在固有卷积神经网络的结构下引入哈希表示层得到短视频在汉明空间中的相应哈希码。本发明不仅捕获了不同模式下哈希码的相对语义相关,而且显著减少了短视频检索的时空复杂度。本发明充分利用视频时空语义信息,进一步提升检索性能。
本发明授权基于深度学习的大规模短视频检索方法、系统及设备在权利要求书中公布了:1.一种基于深度学习的大规模短视频检索方法,其特征在于,包括以下步骤: 步骤1:将查询数据和检索集中短视频,进行关键帧提取与视频标准化处理; 其中,所述关键帧提取,是根据短视频镜头特性,即采取一镜到底的方式进行拍摄,采用等间隔抽取关键帧技术进行关键帧提取; 若输入视频,其中为第i个视频帧,N为视频的总帧数;则提取的关键帧,其中,t代表以秒为单位的视频长度,FPS代表帧率,n是视频挑选的帧数, 所述视频标准化处理,是根据视频尺寸的大小,如果视频图像大于预设值,则进行下采样操作处理,将M×N的图像进行s倍下采样,得到(Ms)×Ns的图像;具体公式如下: 其中,f为视频帧,b为图片分割成的不同的s×s的小块,为均值池化操作; 如果视频图像的尺寸小于预设值,则进插值操作处理,缺少的像素值为横向最近像素点与纵向最近像素点的值的均值;最后将每一帧处理过的图像进行拼接得到完整的视频; 步骤2:将处理后的数据输入短视频语义特征提取网络,利用相似度计算得到相似的T个视频;其中,T为预设值; 所述短视频语义特征提取网络,由特征提取模块和特征哈希码映射模块构成,包括第一3×3×3卷积层、第一1×2×2池化层、第二3×3×3卷积层、第二2×2×2池化层、第三3×3×3卷积层、第三2×2×2池化层、第四3×3×3卷积层、第四2×2×2池化层、第五3×3×3卷积层、第五2×2×2池化层、第一1×4096全连接层、第二1×4096全连接层、哈希层组成; 所述第一3×3×3卷积层、第一1×2×2池化层、第二3×3×3卷积层、第二2×2×2池化层、第三3×3×3卷积层、第三2×2×2池化层、第四3×3×3卷积层、第四2×2×2池化层、第五3×3×3卷积层、第五2×2×2池化层顺序连接,共同构成特征提取模块,输入短视频,经过特征提取模块得到短视频原始特征向量图; 所述第一1×4096全连接层、第二1×4096全连接层、哈希层顺序连接,共同构成特征哈希码映射模块,输入短视频原始特征向量图,经过短视频特征哈希码映射模块得到短视频特征映射后的哈希码; 所述哈希层为被sigmoid函数激活的1×K全连接层,K为预设哈希码长度。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人武汉理工大学,其通讯地址为:430070 湖北省武汉市洪山区珞狮路122号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。