行至智能(北京)技术有限公司周晓琴获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉行至智能(北京)技术有限公司申请的专利一种基于大模型全自动的知识图谱构建方法、系统、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118278508B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410209268.X,技术领域涉及:G06N5/022;该发明授权一种基于大模型全自动的知识图谱构建方法、系统、电子设备及存储介质是由周晓琴设计研发完成,并于2024-02-26向国家知识产权局提交的专利申请。
本一种基于大模型全自动的知识图谱构建方法、系统、电子设备及存储介质在说明书摘要公布了:本发明公开了一种基于大模型全自动的知识图谱构建方法、系统、电子设备及存储介质,包括基于业务类型获取对应的数据样本;对数据样本进行预处理;将预处理数据样本输入至大型语言模型,识别实体信息,实体信息包括实体类型、关系类型和属性类型;基于实体信息,构建知识图谱;基于大模型通过自然语言自动召回图谱知识;本发明利用大型语言模型,从文本数据中推理实体信息,构建高度智能化的知识图谱,并通过大语言模型自动召回图谱知识。
本发明授权一种基于大模型全自动的知识图谱构建方法、系统、电子设备及存储介质在权利要求书中公布了:1.一种基于大模型全自动的知识图谱构建方法,其特征在于,包括: 基于业务类型获取对应的数据样本; 对所述数据样本进行预处理; 将预处理所述数据样本输入至大型语言模型,识别实体信息,所述实体信息包括实体、实体关系和实体属性; 基于所述实体信息,构建知识图谱; 基于所述大型语言模型自动召回所述知识图谱; 其中,所述大型语言模型基于所述业务类型进行选择;所述实体包括名词,利用模型对识别到的实体进行推理,确定其具体类型;所述实体关系包括所述实体之间所属关系词语,使用模型的语义理解能力进行关系抽取,通过训练数据学习实体对之间的关系,利用上下文信息和关键词来推理关系的具体类型;所述实体属性包括描述所述实体特征或状态的词语,模型深入分析文本,了解实体的语义信息,提取属性并理解属性的上下文含义,利用上下文语境和常见模式来推理属性的具体类型; 利用生成的图谱schema中的实体、属性及关系信息,结合大模型的语言理解能力,从相应的数据源中抽取实体的具体实例、属性值、实体间的关系;通过提示prompt工程,设计合适的自然语言描述,使大模型理解需要抽取的实体、属性及关系的上下文,并生成对应的三元组;利用生成的图谱,通过大模型进行语义推理,以发现实体和关系之间的潜在关联;利用大模型的语境理解能力,推断实体之间的逻辑关联,生成更全面的三元组信息,基于实体、关系和属性信息的抽取结果,自动生成知识图谱实例; 获取所述实体信息,合并相似的所述实体信息以及去除出现概率低于阈值的所述实体; 所述数据样本包括结构化数据和非结构化数据; 对所述数据样本进行预处理包括: 去除所述数据样本中包含HTML标签和特殊格式的内容以及去除重复内容; 对所述数据样本进行标准化处理; 数据库根据查询语句从图谱中召回相关数据,包括实体、关系和属性信息;图谱数据溯源,对召回的数据提供原文信息溯源。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人行至智能(北京)技术有限公司,其通讯地址为:100080 北京市海淀区紫金数码园3号楼9层907;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。