卓望数码技术(深圳)有限公司郑伟平获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉卓望数码技术(深圳)有限公司申请的专利视频理解方法、装置、计算机设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120726542B 。
龙图腾网通过国家知识产权局官网在2025-11-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511211470.7,技术领域涉及:G06V20/40;该发明授权视频理解方法、装置、计算机设备及存储介质是由郑伟平设计研发完成,并于2025-08-28向国家知识产权局提交的专利申请。
本视频理解方法、装置、计算机设备及存储介质在说明书摘要公布了:本发明公开了一种视频理解方法,包括:获取待解析视频对应的多模态数据;基于多模态数据进行特征提取处理,得到每种多模态数据对应的模态特征;通过自注意力机制,对模态特征进行增强处理,得到增强后的模态特征;通过多头注意力机制,对增强后的模态特征进行特征融合处理,得到初始融合特征;基于模态特征之间的相似度,对初始融合特征中每种增强后的模态特征的权重进行调整处理,得到目标融合特征;基于目标融合特征进行推理,得到待解析视频的理解结果。通过多模态特征融合与权重动态调整机制,结合自注意力与多头注意力机制实现跨模态信息互补,能够充分利用多模态数据互补性、提升视频理解准确性以及深入挖掘剧情深层含义。
本发明授权视频理解方法、装置、计算机设备及存储介质在权利要求书中公布了:1.一种视频理解方法,其特征在于,所述方法包括: 获取待解析视频对应的多模态数据,所述多模态数据包括视频数据、文本数据和音频数据三者中的至少二种; 基于所述多模态数据进行特征提取处理,得到每种所述多模态数据对应的模态特征; 通过自注意力机制,对所述模态特征进行增强处理,得到增强后的模态特征; 通过多头注意力机制,对所述增强后的模态特征进行特征融合处理,得到初始融合特征; 基于所述模态特征之间的相似度,对所述初始融合特征中每种所述增强后的模态特征的权重进行调整处理,得到目标融合特征; 基于所述目标融合特征进行推理,得到所述待解析视频的理解结果; 所述基于所述模态特征之间的相似度,对所述初始融合特征中每种所述增强后的模态特征的权重进行调整处理,得到目标融合特征,包括: 将所述模态特征之间的相似度,输入至预设的归一化函数,计算得到每种所述增强后的模态特征的目标权重; 将所述初始融合特征中每种所述增强后的模态特征的权重,调整至对应的所述目标权重,得到所述目标融合特征; 所述将所述模态特征之间的相似度,输入至预设的归一化函数,计算得到每种所述增强后的模态特征的目标权重,包括: 基于所述模态特征之间的相似度进行指数运算,得到每种所述增强后的模态特征的指数值; 基于所述指数值进行求和处理,得到归一化因子; 基于每种所述增强后的模态特征的指数值以及所述归一化因子,计算得到每种所述增强后的模态特征的目标权重。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人卓望数码技术(深圳)有限公司,其通讯地址为:518000 广东省深圳市南山区粤海街道高新区社区高新南七道015号深港产学研基地W601;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励