北京理工大学王欣洲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京理工大学申请的专利面向数据价值的索引构建与高效搜索方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116304206B 。
龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310194702.7,技术领域涉及:G06F16/901;该发明授权面向数据价值的索引构建与高效搜索方法是由王欣洲;张志威;袁野;王国仁;赵帅设计研发完成,并于2023-03-03向国家知识产权局提交的专利申请。
本面向数据价值的索引构建与高效搜索方法在说明书摘要公布了:本发明公开了一种面向数据价值的索引构建与高效搜索算法,可用于数据价值的高效存储与搜索;本发明针对使用图数据表达的数据价值,提出了一种基于学习索引的图原生存储结构,将数据的顶点和边分别进行存储并构建索引;本发明提出了基于所述索引的高效搜索算法,用于支持索引的更新和搜索;本发明公开的方法能够有效地存储数据价值,并支持高吞吐量的数据更新和搜索操作。
本发明授权面向数据价值的索引构建与高效搜索方法在权利要求书中公布了:1.一种面向数据价值的索引构建与高效搜索方法,其特征在于,包括索引构建过程、数据插入过程以及数据搜索过程; 所述索引构建过程包括: 将数据价值看作图G=V,E,其中V代表数据价值中的顶点,E代表顶点之间的边; 以图原生的方式实现图G的存储,存储结构分为顶点表和边表;其中边表用于保存顶点的邻边,包括数组结构边表和索引结构边表; 对于顶点表建立索引结构,用于保存顶点编号与顶点块的对应关系,每个顶点块包括以下属性: 1顶点的度,用于保存顶点的邻边数量; 2数组结构边表的位置; 3索引结构边表的位置; 4最大使用位置,记录数组结构的边表当前所保存的最后一个邻边在其结构中的位置; 5数组结构的边表长度,用于记录当前数组边表能够保存的邻边的最大数量; 6位示图,用于记录数组结构边表中各个位置当前是否使用; 顶点表索引和索引结构边表使用学习索引模型建立,其方法包括: 所述索引结构使用树型结构,包括中间节点和叶子节点; 中间节点保存自身在索引结构中的线性函数和孩子节点指针,线性函数由斜率和截距两个参数确定; 叶子节点保存自身在索引结构中的线性函数和数据,保存的数据为键值类型数据,对于顶点表索引,保存的键为顶点编号,值为该顶点编号所对应的顶点块;对于边表索引,保存的键为边的终点,值为空; 初始时,只建立一个叶子节点,线性函数的两个参数均为0,数组容量为1; 当顶点要插入顶点表索引时,从顶点表索引的根节点开始根据孩子节点指针向下访问,当访问到中间节点时,则将要插入的顶点编号作为变量代入节点中保存的线性函数,将计算的结果记为pos1,继续访问中间节点的第pos1个孩子节点,重复此过程直到访问到叶子节点;当访问到叶子节点时,将要插入的顶点编号作为变量代入叶子节点保存的线性函数中,将计算结果记为pos2,从叶子节点的数组pos2位置开始执行指数搜索,搜索到的位置作为顶点的实际插入位置并进行插入;边插入边表索引的过程,与顶点插入顶点索引的过程相同; 当边要插入边表索引时,从边表索引的根节点开始根据孩子节点指针向下访问,当访问到中间节点时,则将要插入的边的终点作为变量代入节点中保存的线性函数,将计算的结果记为pos1,继续访问中间节点的第pos1个孩子节点,重复此过程直到访问到叶子节点;当访问到叶子节点时,将要插入的边的终点作为变量代入叶子节点保存的线性函数中,将计算结果记为pos2,从叶子节点的数组pos2位置开始执行指数搜索,搜索到的位置作为边的实际插入位置并进行插入; 在数据插入或者删除过程中,计算分裂后节点代价,若代价和大于分裂前,则执行训练,反之执行节点分裂; 叶子节点训练过程为,将叶子节点中保存的所有数据和数据所在数组中的位置作为一组变量,使用最小二乘法拟合这组变量的线性关系,得到一个新的线性函数,以此更新叶子节点所保存的线性函数; 叶子节点的分裂过程为,将叶子节点中保存的所有数据均分给分裂得到的两个节点,原叶子节点转化为中间节点; 所述数据插入过程包括:对于待插入的边u,v,在顶点表索引中搜索顶点u的位置,获取其顶点块; 若搜索结果为空,则创建顶点块,按照上述学习索引模型插入到顶点表索引中; 若顶点u当前使用边表索引存储邻边,则按照上述学习索引模型将边e=u,v插入边表索引中; 若顶点u当前使用数组边表存储邻边,且顶点u的度加1等于构建边表索引阈值,则对顶点u的邻边构建索引,采用上述学习索引模型对顶点u的邻边建立边表索引,将e=u,v插入边表索引; 若顶点u当前使用数组边表存储邻边,且未达到构建索引的阈值,则遍历u的数组边表中[0,最大使用位置+1]之间的所有位置,寻找第一个未使用的位置插入e=u,v,若插入位置超过了当前数组边表长度,则将数组边表扩容至2倍再执行插入; 所述数据搜索过程包括以下步骤:对于待搜索的边u,v,在顶点表索引中搜索顶点u的位置,获取其顶点块;若搜索结果为空,则返回空结果; 若顶点u使用数组结构边表保存邻边,则在获取的顶点块的数组结构边表的最大使用位置前搜索边;若顶点u使用索引结构边表保存邻边,则在获取的顶点块的边表索引中搜索边。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励