西安交通大学鲍军鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安交通大学申请的专利基于知识图谱与向量匹配的多模态数据分布式检索方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118551086B 。
龙图腾网通过国家知识产权局官网在2026-03-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410606946.6,技术领域涉及:G06F16/903;该发明授权基于知识图谱与向量匹配的多模态数据分布式检索方法及系统是由鲍军鹏;马俊杰;何超设计研发完成,并于2024-05-16向国家知识产权局提交的专利申请。
本基于知识图谱与向量匹配的多模态数据分布式检索方法及系统在说明书摘要公布了:本发明公开了一种基于知识图谱与向量匹配的多模态数据分布式检索方法及系统,通过分布式数据库存储和组织多模态数据,并建立统一多模态映射模型将多模态数据嵌入成向量并对齐进同一向量子空间,再通过多级动态聚类来建立索引。同时建立多模态知识图谱以支持基于知识图谱的多模态检索,并将两种方式结合实现多模态数据的检索功能。引入分布式技术保证检索过程的准确性与迅捷性。本发明可对多模态数据进行组织与存储,并对其进行嵌入和聚类。同时建立多模态知识图谱,实现跨模态数据的有效关联,结合向量相似度匹配来实现多模态检索功能。又引入分布式机制,实现并行检索,保证系统的高可用性与高效性。
本发明授权基于知识图谱与向量匹配的多模态数据分布式检索方法及系统在权利要求书中公布了:1.一种基于知识图谱与向量匹配的多模态数据分布式检索方法,其特征在于,包括如下步骤: 步骤1,将来自若干多模态数据库节点的多模态数据进行数据清洗后存储; 步骤2,将存储的多模态数据利用多模态数据统一映射模型嵌入为向量,并通过多级动态聚类使所述向量形成树形检索结构,针对每个簇中的数据建立双向链表,通过指向其所属簇簇心向量的指针来查询该簇内的具体数据; 步骤3,将存储的多模态数据以三元组格式存储并建立多模态知识图谱; 步骤4,根据用户输入的检索条件进行多模态数据检索,方法如下:将检索条件嵌入为条件向量,使其与簇心向量在同一空间中,然后并行执行向量检索和多模态知识图谱检索,将两种方式检索出的数据进行打分后整合并排序,返回评分靠前的前n条数据列表,并进行展示; 其中: 所述步骤2,使用增量GMM算法进行多级动态聚类,使所述向量形成树形检索结构,基本聚类过程如下: 首先初始化高斯混合模型,选择部分数据作为初始的高斯分量Ci,并为每个分量分配初始的均值μi和协方差矩阵Σi;然后,使用增量学习方式,逐步将新数据点加入到已有高斯混合模型中,并根据模型参数动态更新聚类结果,使用期望最大化算法更新每个高斯分量的均值μi和协方差矩阵Σi,以及每个分量的权重wi,直至聚类完成; 当某个簇数量大于簇最大容量n时,重复上述聚类过程,对该簇进行下一级的增量动态聚类,最终形成多级树型向量索引; 所述针对每个簇中的数据建立双向链表,通过指向其所属簇簇心向量的指针来查询该簇内的具体数据,方法如下: 针对所述树型索引结构中的每个簇,提取其中的特征和关键词,生成代表该簇特征的词云; 对索引树的叶子节点及该节点包含的具体数据建立双向链表,即,利用每个高斯分量的均值代表簇心,并建立与簇心向量的双向指针,对于每个高斯分量,记录下其代表的簇心、该簇所包含的所有数据点以及它们在原始数据集中的位置信息;当需要根据给定的簇心快速检索簇内数据时,根据双向指针找到该簇心所代表的所有数据点。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安交通大学,其通讯地址为:710049 陕西省西安市碑林区咸宁西路28号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励