哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)刘川意获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)申请的专利基于大语言模型的Text-to-SQL生成方法、系统及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120743942B 。
龙图腾网通过国家知识产权局官网在2026-02-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511255497.6,技术领域涉及:G06F16/2452;该发明授权基于大语言模型的Text-to-SQL生成方法、系统及存储介质是由刘川意;许文博;颜亮;韩培义;朱海峰;段少明设计研发完成,并于2025-09-04向国家知识产权局提交的专利申请。
本基于大语言模型的Text-to-SQL生成方法、系统及存储介质在说明书摘要公布了:本发明公开了一种基于大语言模型的Text‑to‑SQL生成方法、系统及存储介质,方法包括关键词提取和模糊检测:提取文本中的数据内容关键词,推测关联数据表和列,以及数据内容同义词,并根据推测结果生成可执行的种子SQL进行模糊检测;编码知识获取和对齐:根据模糊检测搜索结果获取编码知识;从编码知识表中检测与各数据内容关键词最相关的知识,并构成编码知识集合;SQL语句生成和修改:根据编码知识集合生成模糊SQL并执行,根据反馈结果和编码知识集合进行多轮修改,生成最终SQL。本发明提高获取Text‑to‑SQL的效率,能够准确地从数据库中搜索到与自然语言问题相关的数据。
本发明授权基于大语言模型的Text-to-SQL生成方法、系统及存储介质在权利要求书中公布了:1.一种基于大语言模型的Text‑to‑SQL生成方法,其特征在于,所述方法包括以下步骤: 关键词提取和模糊检测:提取文本中的数据内容关键词,推测关联数据表和列,以及数据内容同义词,并根据推测结果生成可执行的种子SQL进行模糊检测; 编码知识获取和对齐:根据模糊检测搜索结果获取编码知识;从编码知识表中检测与各数据内容关键词最相关的知识,并构成编码知识集合; SQL语句生成和修改:根据编码知识集合生成模糊SQL并执行,根据反馈结果和编码知识集合进行多轮修改,生成最终 SQL; 关键词提取和模糊检测过程中,对输入的自然语言文本、数据库模式以及出现频率最高的前N个数据内容样例,基于大语言模型的上下文语义学习模块,提取自然语言文本中的数据内容关键词和数据内容同义词,并根据数据库模式确认数据库表名和列名字段,根据数据库表名和列名字段生成一系列和数据内容关键词关联的存储内容的种子SQL; 将待生成的种子 SQL拆解为列名字段、数据内容、SQL语句骨架三个类型互相独立的种子,并针对各类型的种子初始化种子池,其中,针对列名字段,将提取的数据内容关键词相关的数据库列名字段作为种子池;数据内容为使用大语言大模型根据数据内容关键词和相关列生成的同义词,将数据内容关键词和同义词作为种子池;SQL语句骨架设定两个候选查询SQL模板作为种子池。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),其通讯地址为:518000 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励