烟台海颐软件股份有限公司于瑞强获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉烟台海颐软件股份有限公司申请的专利面向LLM-Text2SQL的数据库表关系探索方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121070988B 。
龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511612134.3,技术领域涉及:G06F16/2455;该发明授权面向LLM-Text2SQL的数据库表关系探索方法是由于瑞强;林嘉懿;喻魏贤;李晓宇;李帅;李静设计研发完成,并于2025-11-06向国家知识产权局提交的专利申请。
本面向LLM-Text2SQL的数据库表关系探索方法在说明书摘要公布了:本发明属于数据库技术领域,具体涉及面向LLM‑Text2SQL的数据库表关系探索方法。该方法采用多阶段协同处理策略,整合数据库元数据与数据内容特征,通过大语言模型对原始信息进行语义增强与结构化补全。在此基础上,结合基于特征相似度的算法筛选潜在关联候选集,并融合预定义规则与大语言模型推理机制进行关联关系的多维度验证与判定,最终生成支持交互式编辑与迭代优化的实体关系图。该方法实现了从约束缺失、数据完整性受损的异构数据库到规范化ER图的端到端自动化处理,为显著的提升基于大语言模型的自然语言SQL生成的成功率奠定了坚实的基础。
本发明授权面向LLM-Text2SQL的数据库表关系探索方法在权利要求书中公布了:1.一种面向LLM-Text2SQL的数据库表关系探索方法,其特征在于,包括以下步骤: 步骤100:通过扫描数据库系统目录获取元数据,同时分析数据内容特征; 步骤200:候选关联关系生成:通过矢量相似度为每个字段检索出其相似的字段、通过业务文档检索出相关的字段,计算字段间的相似程度、值的包含程度;并通过大语言模型对字段语义进行解析,结合业务领域知识库扩展候选关联关系范围; 步骤300:建立规则引擎与大语言模型推理协同的双重验证机制,进行候选关联关系的多维度验证与判定; 步骤400:将验证通过的关联关系转化为标准ER图模型,以可交换格式导出ER图; 所述步骤100包括: 初始化属性图,初始化属性图为7元组,包括属性图节点、边、属性名、值的集合、全函数、关系、偏函数; 从关系数据库的系统目录中获取所有表的信息,将所有的表及其信息作为表的属性,合并进初始化属性图中,得到第一属性图; 从关系数据库的每张表中提取字段及其基本信息,并分析该字段下的所有值来生成字段内容特征,得到含字段基本信息与内容特征的属性图;用边连接字段与所属表,得到描述字段-表连接关系的属性图;将含字段基本信息与内容特征的属性图和描述字段-表连接关系的属性图合并进第一属性图,得到第二属性图; 对每张表的字段,生成每个字段的描述,得到字段描述属性图,合并进第二属性图中,得到第三属性图; 对每个字段的每个描述生成语义矢量,形成语义描述属性图,添加进第三属性图中,得到第四属性图; 所述步骤200中具体包括: 通过矢量相似度为满足预设条件的每个字段检索出其相似的字段,并从相关业务文档中检索得到高相关度的字段;将相似的字段、不同表的同名字段及在知识图谱中检索得到高相关度的字段,并入相关字段的总集合中; 基于相关字段总集合中每个相似字段,计算值的包含程度; 若包含程度达到预设阈值,则通过大语言模型判定字段间存在关联的信度; 基于包含程度和信度生成包含程度属性图和信度属性图,将包含程度属性图和信度属性图合并第四属性图中,得到第五属性图; 通过大模型探测数据库表可能的复合唯一键,经数据验证和去函数依赖处理后存入第五属性图,再为组合键涉及字段重复操作生成并合并成最终属性图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人烟台海颐软件股份有限公司,其通讯地址为:264000 山东省烟台市开发区珠江路32号(III-5小区);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励