Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京亦庄智能城市研究院集团有限公司鹿馨方获国家专利权

北京亦庄智能城市研究院集团有限公司鹿馨方获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京亦庄智能城市研究院集团有限公司申请的专利基于深度学习的多模态数据配对方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120994874B

龙图腾网通过国家知识产权局官网在2026-03-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511529500.9,技术领域涉及:G06F16/783;该发明授权基于深度学习的多模态数据配对方法及系统是由鹿馨方;邱磊设计研发完成,并于2025-10-24向国家知识产权局提交的专利申请。

基于深度学习的多模态数据配对方法及系统在说明书摘要公布了:本发明提供基于深度学习的多模态数据配对方法及系统,涉及数据处理技术领域,包括获取视频多帧序列与目标文本,分别提取重叠帧组集合及规范化文本序列;进行时空特征提取和文本依存关系编码,得到视频时序向量序列和文本向量序列;执行跨模态对齐搜索,构建单调匹配路径集合;计算路径上配对元素的语义及动作实体关系一致性分数,获取综合得分;基于最优路径确定视频与文本对齐关系。本方法实现了视频与文本的精准匹配,提高跨模态检索效率。

本发明授权基于深度学习的多模态数据配对方法及系统在权利要求书中公布了:1.基于深度学习的多模态数据配对方法,其特征在于,包括: 获取待处理视频的原始多帧序列与目标文本,针对所述原始多帧序列中的每一帧以固定采样间隔提取时序片段,形成包含相邻帧重叠的帧组集合;对所述目标文本执行分句处理与词法规范化处理,保留词序并记录每一词语的出现位置索引,形成可对齐的文本序列; 对所述帧组集合进行时空特征提取,得到与时间索引对应的视频时序向量序列;同时对所述文本序列进行嵌入映射与依存关系编码,利用图结构的消息传递运算将句法依存关系约束注入到词向量中,得到与词序索引对应的文本向量序列; 在保持视频与文本各自时间顺序不被打乱的前提下,执行跨模态对齐搜索,采用分层候选扩展策略在视频向量时序与文本向量序列之间构建单调匹配路径集合,并以匹配路径的累计代价作为排序依据,输出候选路径,包括: 基于视频时间索引与文本词序索引的取值范围,构建二维搜索网格;对所述二维搜索网格生成原子代价,并将所述原子代价缓存为局部代价表;在所述二维搜索网格上以起始边界作为根状态,将所述根状态置入第一层候选集合,形成控制量集合; 针对所述控制量集合中的每一候选状态,从所述局部代价表中读取对应网格位置的网格代价,将所述网格代价结合该候选状态计算新累计代价,将所述新累计代价附加至已匹配配对序列,形成满足单调性的部分匹配路径,并以对齐状态构成新的候选状态,加入当前层的扩展结果集合; 对所述扩展结果集合按照所述新累计代价从小到大排序,执行束式裁剪,将裁剪后的候选状态传递至下一层,并在传递时依据层级计数与最大扩展步数进行终止检查; 在达到所述最大扩展步数或全部候选状态均转为完成状态时,汇聚当前完成状态集合对每条配对序列进行核对,将通过核对的所述配对序列以网格坐标形式回写到候选路径缓存区,形成满足约束的候选路径; 计算所述候选路径上配对元素的语义一致性分数、动作实体关系一致性分数,并在多目标加权约束下得到候选路径的综合得分; 以综合得分最高的候选路径确定视频时序片段与文本片段的对齐关系,并基于该对齐关系对文本片段进行自适应权重加权,得到针对视频内容的文本匹配结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京亦庄智能城市研究院集团有限公司,其通讯地址为:100176 北京市大兴区北京经济技术开发区荣华中路10号1幢18层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。