阿里巴巴达摩院(杭州)科技有限公司刘烁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉阿里巴巴达摩院(杭州)科技有限公司申请的专利视频处理方法、装置及计算机可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114140708B 。
龙图腾网通过国家知识产权局官网在2025-07-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110937670.6,技术领域涉及:G06V20/40;该发明授权视频处理方法、装置及计算机可读存储介质是由刘烁;王超群;全卫泽;严冬明;刘媛;李威;雷鸣设计研发完成,并于2021-08-16向国家知识产权局提交的专利申请。
本视频处理方法、装置及计算机可读存储介质在说明书摘要公布了:本发明公开了一种视频处理方法、装置及计算机可读存储介质。其中,该方法包括:接收待处理视频,并对待处理视频进行特征提取,以得到待处理视频的初始视频特征和初始音频特征;通过初始音频特征确定多个维度上的权重参数,并基于第一注意力模块利用多个维度上的权重参数对初始视频特征进行增强处理,以得到增强的视频特征;基于增强的视频特征预测待处理视频中的视听事件。本发明解决了相关技术中粗粒度的视频检测方法,导致视频中视听事件检测不准确的技术问题。
本发明授权视频处理方法、装置及计算机可读存储介质在权利要求书中公布了:1.一种视频处理方法,其特征在于,包括: 接收待处理视频,并对所述待处理视频进行特征提取,以得到所述待处理视频的初始视频特征和初始音频特征; 通过所述初始音频特征确定多个维度上的权重参数,并基于第一注意力模块利用多个维度上的权重参数对所述初始视频特征进行增强处理,以得到增强的视频特征,其中,所述多个维度至少包括通道维度、空间维度和时间维度; 基于所述增强的视频特征预测所述待处理视频中的视听事件; 其中,所述多个维度上的权重参数包括第一维度注意力权重参数、第二维度注意力权重参数和第三维度注意力权重参数,所述第一维度为所述通道维度,所述第二维度为所述空间维度,所述第三维度为所述时间维度;基于第一注意力模块利用多个维度上的权重参数对所述初始视频特征进行增强处理,包括:使用所述第一维度注意力权重参数对所述初始视频特征进行增强,得到第一维度视频特征;基于所述第二维度注意力权重参数、所述第三维度注意力权重参数和所述第一维度视频特征,得到所述增强的视频特征,所述第二维度注意力权重参数通过在第二维度上对所述初始音频特征和所述第一维度视频特征进行融合得到,所述第三维度注意力权重参数通过在第三维度上对所述初始音频特征和所述第一维度视频特征进行融合得到。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人阿里巴巴达摩院(杭州)科技有限公司,其通讯地址为:310023 浙江省杭州市余杭区五常街道文一西路969号3幢5层516室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。