浙江大学伍赛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学申请的专利基于决策树的数据库代价模型参数优化方法及其查询方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115576970B 。
龙图腾网通过国家知识产权局官网在2025-06-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211054493.8,技术领域涉及:G06F16/242;该发明授权基于决策树的数据库代价模型参数优化方法及其查询方法是由伍赛;贺婷婷;杨佳妮;陈刚;陈珂;寿黎但设计研发完成,并于2022-08-31向国家知识产权局提交的专利申请。
本基于决策树的数据库代价模型参数优化方法及其查询方法在说明书摘要公布了:本发明公开了一种基于决策树的数据库代价模型参数优化方法及其查询方法。针对特定软硬件设置下的数据库实例,本发明建立了一棵数据库代价模型参数树,使用数据库配置参数、查询语句特征作为分裂维度对参数空间进行分区,每个分区中通过对训练样本的线性拟合求解最优的代价模型参数。在运行过程中,参数树为不同参数配置及数据分布下的查询语句分配不同的代价模型参数,从而进行精准的代价预测。实验表明该方法提高了传统基于规则的估计模型的预测准确度,优化了数据库的查询性能。
本发明授权基于决策树的数据库代价模型参数优化方法及其查询方法在权利要求书中公布了:1.一种基于决策树的数据库代价模型参数优化方法,其特征在于,包括如下步骤: S1、在数据库实例中运行预定义的查询语句集合,得到集合中的每一条查询语句对应的查询语句执行结果;从每一条查询语句执行结果中分别提取数据操作的关键特征以及执行时间,作为一个第一训练样本;利用所有第一训练样本作为拟合数据,对线性模型形式的代价模型进行拟合,将拟合得到的代价模型参数初始值作为代价模型参数树的根节点; S2、执行数据库工作负载中的不同查询语句,且针对每个查询语句以最新的代价模型参数树作为决策树,通过数据库配置参数与查询语句特征在决策树中导航至对应节点,从而确定用于计算不同执行计划代价的代价模型参数,并从查询语句执行结果中提取数据操作的关键特征以及执行时间,作为对应节点关联的第二训练样本;当决策树中一个节点关联的第二训练样本达到节点分裂条件时,以数据库配置参数和查询语句特征为可分裂维度,对代价模型参数树采用基于模型的递归分区方法进行节点分裂从而形成对应不同子空间的子节点,再将父节点上的第二训练样本对应划分至各子节点上并分别拟合得到各子节点对应的代价模型参数; S3、不断执行S2,以增量学习方式对决策树进行迭代训练从而不断进行节点分裂,使得训练后的决策树上不同叶子节点分别拥有对应于不同数据库配置参数和查询语句特征的代价模型参数;最终以训练后的决策树为给定数据库配置参数下的查询语句确定代价模型参数,用于供数据库实例估计执行计划的代价; 所述S2的具体流程如下: S21、数据库执行工作负载,并在执行的同时记录查询语句的执行计划以及查询语句执行时的数据库配置参数,再根据查询语句特征以及查询语句执行时的数据库配置参数从决策树上查找对应的叶子节点,然后将叶子节点拥有的代价模型参数输入所述代价模型中,计算各执行计划的执行代价,选择代价最小的执行计划予以执行;在执行完毕后数据库从记录的查询语句执行结果中提取执行计划中数据操作的关键特征及执行时间,形成代价模型参数树中对应叶子节点下的第二训练样本; S22、不断重复S21,在代价模型参数树的叶子节点上累积第二训练样本,若存在一个叶子节点下的第二训练样本集合达到节点分裂条件后,针对该叶子节点采用基于模型的递归分区方法选择分裂维度与分裂值形成多个子节点,再将父节点上的第二训练样本对应划分至各子节点上,并以每个子节点上的所有第二训练样本作为拟合数据重新对所述代价模型进行拟合,得到各个子节点对应的代价模型参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。