广州钛动科技股份有限公司岑德炼获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州钛动科技股份有限公司申请的专利一种基于多模态模型的高光亮点提取方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120708124B 。
龙图腾网通过国家知识产权局官网在2025-12-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510807807.4,技术领域涉及:G06V20/40;该发明授权一种基于多模态模型的高光亮点提取方法及系统是由岑德炼;林佳;杨波设计研发完成,并于2025-06-17向国家知识产权局提交的专利申请。
本一种基于多模态模型的高光亮点提取方法及系统在说明书摘要公布了:本发明涉及图像数据提取技术领域,尤其涉及一种基于多模态模型的高光亮点提取方法及系统,所述方法在响应于视频素材的输入之后,先将视频素材进行片段分割,得到多个重叠子片段,然后将多个重叠子片段输入预设的多模态大模型中进行联合特征提取,得到混合特征,再从混合特征中提取出历史片段特征和当前片段特征,接着,将历史片段特征和当前片段特征输入预设的时空交叉注意力机制模型中,计算得到时间维度上的注意力得分矩阵,最后,将注意力得分矩阵中得分大于预设阈值的元素对应的高光片段作为高光亮点。相较于现有技术,本发明方法解决了现有技术针对性差及提取效率低的技术问题。
本发明授权一种基于多模态模型的高光亮点提取方法及系统在权利要求书中公布了:1.一种基于多模态模型的高光亮点提取方法,其特征在于,包括: 响应于视频素材的输入,将所述视频素材进行片段分割,得到多个重叠子片段; 将多个重叠子片段输入预设的多模态大模型中进行联合特征提取,得到混合特征; 从所述混合特征中提取出历史片段特征和当前片段特征; 将所述历史片段特征和所述当前片段特征输入预设的时空交叉注意力机制模型中,计算得到时间维度上的注意力得分矩阵; 将所述注意力得分矩阵中得分大于预设阈值的元素对应的高光片段或高光节点作为高光亮点; 将多个重叠子片段输入预设的多模态大模型中进行联合特征提取,得到混合特征的具体表达式为: 式中,表示视频素材的第个混合特征,表示多模态大模型,表示视频素材的第个重叠子片段,表示跨模态注意力融合运算符,表示视频素材中第个视觉模态特征,表示视频素材中第个音频模态特征,表示视频素材中第个文本或字幕模态特征; 在将多个重叠子片段输入预设的多模态大模型中进行联合特征提取,得到混合特征之前,所述方法还包括: 配置高光推理引擎,所述高光推理引擎用于驱动多模态大模型关注所述视频素材的剧情连续性; 所述高光推理引擎包括Prompt动态进化机制,所述Prompt动态进化机制具体表示式为: 式中,表示第次迭代生成的Prompt,表示基础Prompt,表示拼接函数,表示前次推理的摘要特征,用于总结前一次推理过程中多模态数据的关键信息; 所述高光推理引擎还设置了用于定义双目标优化的多模态奖励函数,其中,定义的双目标优化包括相邻重叠子片段的连贯性奖励和观众吸引力奖励; 所述多模态奖励函数的定义式为: 式中,表示对参数进行最大化操作,表示期望运算符,表示从时间步到的求和,表示折扣因子,表示在时间步状态下重叠子片段的连贯性奖励,表示超参数,表示在时间步状态下重叠子片段的观众吸引力奖励。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州钛动科技股份有限公司,其通讯地址为:510000 广东省广州市天河区高唐路265号202;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励