数据空间研究院朱仁兵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉数据空间研究院申请的专利一种基于LLM多表自适应选择的NL2SQL方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117112732B 。
龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311096482.0,技术领域涉及:G06F16/242;该发明授权一种基于LLM多表自适应选择的NL2SQL方法是由朱仁兵;周锐;王佐成设计研发完成,并于2023-08-29向国家知识产权局提交的专利申请。
本一种基于LLM多表自适应选择的NL2SQL方法在说明书摘要公布了:本发明涉及自然语言处理技术领域,具体是一种基于LLM多表自适应选择的NL2SQL方法,本发明包括以下操作步骤:提取参与查询的原始数据库中的代表字段信息,以代表字段信息的内容构建数据知识库;从输入大模型中自然语言语句中抽取实体信息和时间信息;对实体信息与代表字段信息进行模糊匹配查询,通过匹配查询结果获取实体信息在数据知识库中对应的库表信息;将从自然语言语句中抽取的实体信息和时间信息连同库表信息一同输入大模型中,以得到带时间消息的SQL语句和不带时间的SQL语句;通过时间信息和字段信息对生成的SQL语句进行校正;本发明实现了多表自适应选择,提高了SQL生成的正确率,进而满足通用业务应用的实践要求。
本发明授权一种基于LLM多表自适应选择的NL2SQL方法在权利要求书中公布了:1.一种基于LLM多表自适应选择的NL2SQL方法,其特征在于,包括以下操作步骤: S1、构建数据知识库:提取参与查询的原始数据库中的代表字段信息,以代表字段信息的内容构建数据知识库; S2、语义分析处理:从输入大模型的自然语言语句中抽取实体信息和时间信息,并通过正则化的方式将时间信息转化为SQL语句; S3、数据库表选择:对实体信息与代表字段信息进行模糊匹配查询,通过匹配查询结果获取实体信息在数据知识库中对应的库表信息; S4、大模型生成SQL语句:将从自然语言语句中抽取的实体信息和时间信息连同库表信息一同输入大模型中,以得到带时间信息的SQL语句和不带时间信息的SQL语句; S5、SQL语句校正:通过时间信息和字段信息对生成的SQL语句进行校正; SQL语句校正的具体步骤如下: S51、对比带时间信息的SQL语句和不带时间信息的SQL语句,定位出带时间信息的SQL语句中的时间字段; S52、验证大模型生成的带时间信息的SQL语句与规则解析的时间SQL语句的执行结果是否相同;若执行结果相同,则以带时间信息的SQL语句作为对应自然语言生成的时间校正SQL语句;若执行结果不同,则以不带时间信息的SQL语句加上规则转换的时间SQL语句作为对应自然语言生成的时间校正SQL语句; S53、接着对大模型生成的时间校正SQL语句中的字段信息与数据知识库中对应的字段消息进行对比;若两个字段信息保持一致,则以时间校正SQL语句作为最终的SQL语句;若两个字段信息不能保持一致,则以相似度检索匹配的字段信息替换时间校正SQL语句中的字段消息,并以字段信息替换后的时间校正SQL语句作为最终的SQL语句。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人数据空间研究院,其通讯地址为:231200 安徽省合肥市高新区柏堰科技园创新大道288号工投高新智谷B区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。