每日互动股份有限公司;杭州西湖数据智能研究院董霖获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉每日互动股份有限公司;杭州西湖数据智能研究院申请的专利一种基于大语言模型的SQL语句生成方法、介质及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119862200B 。
龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411969390.3,技术领域涉及:G06F16/242;该发明授权一种基于大语言模型的SQL语句生成方法、介质及设备是由董霖;潘彦霖;吴宇森;尹雅露设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。
本一种基于大语言模型的SQL语句生成方法、介质及设备在说明书摘要公布了:本发明涉及数据处理领域,尤其涉及一种基于大语言模型的SQL语句生成方法、介质及设备,通过对初始语句进行关键词提取并与预设关键词配置表匹配获取目标正则表达,能够精准捕捉自然语言中的关键语义信息,将模糊、多样的自然语言表述按照既定的业务规则进行规范,避免大语言模型对用户意图的错误解读,同时通过从众多历史语句中筛选出与初始语句相似度较高、对当前SQL语句生成有借鉴意义的参考语句,有助于预设大语言模型基于以往类似情况生成更准确、符合用户意图的SQL语句,提高了SQL语句的生成准确性。
本发明授权一种基于大语言模型的SQL语句生成方法、介质及设备在权利要求书中公布了:1.一种基于大语言模型的SQL语句生成方法,其特征在于,所述SQL语句生成方法包括如下步骤: S10,获取到历史输入数据库、目标用户输入的初始语句、所述初始语句对应的目标场景和目标表格,以及所述目标场景对应的目标向量转换模型和预设关键词配置表,其中,所述历史输入数据库中包括若干个历史语句、每个历史语句对应的历史语句向量和历史SQL语句,所述预设关键词配置表中包括若干个自定义关键词和每个自定义关键词对应的正则表达,S10包括如下步骤: S101,获取初始向量转换模型、若干个预设表格对应的描述文本样本、每个描述文本样本对应的预设场景和描述向量样本、每个预设场景对应的预设采样比例; S102,将预设采样比例确定为目标采样比例,将每个预设场景确定为初始场景,初始化重复次数N=1; S103,根据每个初始场景对应的目标采样比例从所述若干个描述文本样本中进行采样,获取到第N个描述文本训练样本集、第N个描述文本验证样本集,以及每个初始场景在所述第N个描述文本训练样本集中对应的描述文本样本的第N数量; S104,根据所述第N个描述文本训练样本集、所述第N个描述文本验证样本集和每个描述文本样本对应的描述向量样本,对所述初始向量转换模型进行训练,获取到第N个向量转换模型和每个初始场景在所述第N个向量转换模型中的第N准确率; S105,根据每个初始场景对应的第N数量和第N准确率,获取到每个初始场景与所述第N个向量转换模型的第N适配程度; S106,针对任一初始场景,根据当前初始场景对应的第N适配程度与预设程度阈值的比较结果,确定当前初始场景对应的适配结果,其中,所述适配结果包括适配、不适配和待判断; S107,若当前初始场景对应的适配结果为适配,则将当前初始场景确定为第一场景,并将所述第N个向量转换模型确定为当前第一场景对应的目标向量转换模型; S108,若当前初始场景对应的适配结果为不适配,则将当前初始场景确定为第二场景; S109,若当前初始场景对应的适配结果为待判断,则将当前初始场景确定为第三场景; S110,遍历所有的初始场景,获取到所有的第一场景和每个第一场景对应的目标向量转换模型、所有的第二场景、所有的第三场景和第三场景对应的场景数量; S111,根据每个描述文本样本对应的预设场景和描述向量样本,获取到每个第二场景对应的目标描述文本样本集; S113,根据每个第二场景对应的目标描述文本样本集和每个描述文本样本对应的描述向量样本,对所述初始向量转换模型进行训练,获取到每个第二场景对应的目标向量转换模型; S114,若所述场景数量大于0,则更新每个第三场景对应的预设采样比例并将更新后的预设采样比例确定为目标采样比例,将每个第三场景确定为初始场景,更新N=N+1,并重复执行步骤S103,直至更新后的场景数量等于0,获取到每个预设场景对应的目标向量转换模型; S115,根据每个预设场景对应的目标向量转换模型,获取到所述目标场景对应的目标向量转换模型; S20,对所述初始语句进行关键词提取,获取到所述初始语句对应的若干个目标关键词; S30,对每个目标关键词和所述预设关键词配置表进行匹配,获取到每个目标关键词对应的匹配结果,其中,所述匹配结果包括对应的自定义关键词和对应的正则表达组成的集合; S40,根据所有的目标关键词的匹配结果,获取到所述初始语句对应的若干个目标正则表达; S50,根据所述初始语句对应的目标场景对应的目标向量转换模型,获取到所述初始语句对应的语句向量; S60,根据所述语句向量和每个历史语句对应的历史语句向量,获取到所述初始语句与每个历史语句之间的相似程度; S70,根据所述初始语句与每个历史语句之间的相似程度和预设相似程度阈值的比较,从所有的历史语句中筛选出所述初始语句对应的若干个参考语句; S80,将所述语句向量、所述目标表格、所述初始语句对应的若干个目标正则表达、所述初始语句对应的若干个参考语句和每个参考语句对应的历史SQL语句输入至预设大语言模型中,获取到所述初始语句对应的SQL语句。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人每日互动股份有限公司;杭州西湖数据智能研究院,其通讯地址为:310000 浙江省杭州市西湖区荆大路100号1号楼808室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励