Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 西安电子科技大学宋胜利获国家专利权

西安电子科技大学宋胜利获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉西安电子科技大学申请的专利一种大规模图数据高效查询方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116383247B

龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310363981.5,技术领域涉及:G06F16/2453;该发明授权一种大规模图数据高效查询方法是由宋胜利;陶怡;杨琦;胡光能设计研发完成,并于2023-04-06向国家知识产权局提交的专利申请。

一种大规模图数据高效查询方法在说明书摘要公布了:本发明公开了一种大规模图数据高效查询方法,包括:对图数据进行划分,得到图数据的初始分区;其中,所述初始分区包括每个顶点向量的二进制签名以及对应的哈希桶;对图数据的初始分区进行调整,得到新的分区;将RDF格式的图数据转换为属性图格式并存储;基于SPARQL查询语句,得到连接计划;根据连接计划和SPARQL查询映射算法,在分布式数据库中得到查询结果。本发明节约了图数据的查询时间。

本发明授权一种大规模图数据高效查询方法在权利要求书中公布了:1.一种大规模图数据高效查询方法,应用于对分布式数据库中图数据的查询,其特征在于,包括: 步骤1:对图数据进行划分,得到图数据的初始分区;其中,所述初始分区包括每个顶点向量的二进制签名以及对应的哈希桶; 步骤2:对图数据的初始分区进行调整,得到新的分区; 步骤3:将RDF格式的图数据转换为属性图格式并存储; 步骤4:基于SPARQL查询语句,得到连接计划; 步骤5:根据连接计划和SPARQL查询映射算法,在分布式数据库中得到查询结果; 所述步骤1具体包括: 选取Word2Vec作为向量化工具,将每个顶点的各个属性表示为词向量,利用加权平均模型计算出顶点向量; 将所有顶点向量作为局部敏感哈希算法的输入,得到每个顶点向量的二进制签名以及对应的哈希桶; 所述步骤2包括: 假设现有图数据的初始分区包括k个分区结果P={p1,p2,...,pk},每个分区的最大负载MaxSize;现有图数据为G=V,E,V={v1,...,vn}为顶点集合,E={e1,...,em}为边集合,|V|=n,|E|=m; 分别计算vi在pi中的Scoreadjacent得分; 将pi中的所有vi按照Scoreadjacent大小排序; 当从Scoreadjacent得分最小的vi开始,分别计算vi在其他分区的Scoremovevi,p得分,将所有得分排序并取出vi得分最大的分区pj; 当取出vi得分次大的分区pj;否则,将vi分配给pj并且更新pi以及缓存表; 最终输出调整后的分区; 所述步骤3包括: 将RDF格式转换为属性图格式,然后以顶点为存储粒度,作为HBase的每一行,存储与该顶点相关的属性与关系; 所述步骤3具体包括: 分别针对每条三元组数据s,p,o,根据Resource确定顶点的类型,将URI作为顶点的一个属性; 若o是文字,则将p作为顶点的属性名,o作为顶点属性值; 若o是资源,则将p映射为边,对p进行唯一编号,p的值作为属性值;将s和o的URI也作为p的属性,代表p连接的两个顶点; 所述步骤4包括: 步骤41:解析SPARQL查询语句,得到每个主语变量的三元组模式集合Plan={T1,T2,…Tp};所述SPARQL查询语句包含n个三元组模式T={t1,t2,…tn}; 步骤42:从包含三元组模式最多的集合开始遍历,依次删除前面已经遍历过的三元组模式,得到连接计划,所述连接计划包含m个集合Plan={T1,T2,…Tm},每个集合代表一个三元组模式子集; 所述步骤42具体包括: 在Plan={T1,T2,…Tp}中依次遍历Ti: 若Ti中包含主语已知的三元组模式tj,则将tj排在第一个位置并将Ti标记为Type-S; 若Ti中包含谓词和宾语已知的三元组模式tj,则将tj排在第一个位置并将Ti标记为Type-PO; 若Ti中不包含主语以及谓词和宾语已知的三元组模式tj,将Tj中的子句首先按照变量个数从小到大排序;如果出现tj和tk的变量个数相同,则已知谓词的排在前面;如果tj和tk都已知谓词,则在二级索引表中扫描,将结果集小的排在前面; 遍历结束后,得到连接计划; 所述步骤5包括: 初始化当前的RDD为第一次循环的结果;RDD为key-value键值对,key表示要连接的变量,value表示迭代过程中的非连接变量; 在连接计划包含的m个集合Plan={T1,T2,…Tm}中开始遍历: 若Ti有标识Type-SorType-PO,则通过SPARQL查询映射算法执行Ti中的第一个语句得到结果Rows;根据Rows将Ti中剩余的子句变量进行绑定;将所有结果合并,形成newRDD并保存在内存中;否则,在Ti中对tj进行遍历:通过SPARQL查询映射算法得到结果集;根据查询条件调整key-value,将结果转换为newRDD;将newRDD与上一步的RDD连接形成新的newRDD并保存在内存中; 所有的遍历结束后,取出结果集中的需要的值,即得到查询结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学,其通讯地址为:710071 陕西省西安市雁塔区太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。