众合云科信息技术集团有限公司代小林获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉众合云科信息技术集团有限公司申请的专利一种基于大模型的知识库管理系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119558397B 。
龙图腾网通过国家知识产权局官网在2025-09-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510118526.8,技术领域涉及:G06N5/025;该发明授权一种基于大模型的知识库管理系统是由代小林;赵正伟;周红艳;刘莹莹设计研发完成,并于2025-01-24向国家知识产权局提交的专利申请。
本一种基于大模型的知识库管理系统在说明书摘要公布了:本发明涉及知识库管理技术领域,尤其涉及一种基于大模型的知识库管理系统,该系统包括数据采集模块、数据处理模块、知识库构建模块以及验证模块。本发明通过对文本数据进行连续扫描,以去除重复内容,避免分词错误,通过将社保领域的源数据进行分类,以收集其中的非结构化数据进行数据转化,即通过对非结构数据中的文本进行处理,识别出文本中的实体和概念,以及识别和记录实体间的关系,提高数据的可用性和查询效率,通过结合用户的反馈数据,验证分词处理的准确性,通过记录用户的查询数据,自动识别是否出现错误的分词结果,进而调整分词处理流程和模型训练参数,实现有效管理社保服务系统。
本发明授权一种基于大模型的知识库管理系统在权利要求书中公布了:1.一种基于大模型的知识库管理系统,其特征在于,包括, 数据采集模块,其通过API接口与各类社保数据源进行实时数据采集,得到原始社保数据; 数据处理模块,其与所述数据采集模块相连,其用以将所述原始社保数据分为一类社保数据和二类社保数据,以及对所述一类社保数据进行清洗,得到目标社保数据; 其中,一类社保数据为结构化数据和半结构化数据,二类社保数据为非结构化数据; 知识库构建模块,其与所述数据处理模块相连,其利用大模型对所述目标社保数据进行分析,以提取实体词语,以及结合关系抽取模型得到社保本体图,进而构建知识图谱; 所述知识库构建模块包括数据提取单元、本体构建单元以及知识图谱构建单元,其中, 所述数据提取单元,其用以提取所述二类社保数据中的文本数据,得到目标社保数据; 所述本体构建单元,用以对目标社保数据进行实体识别和关系抽取,得到社保本体图; 所述知识图谱构建单元,用以使用图数据库将所述社保本体图存储为知识图谱; 验证模块,其与所述知识库构建模块相连,其用以对所述知识图谱进行验证,根据验证结果对模型设置参数或数据处理流程进行调整; 其中,对数据处理流程进行调整的过程为将查询关键词存入社保数据库中进行储存;模型设置参数为模型训练的批量大小; 所述验证模块包括记录单元、计算单元、判定单元以及调整单元,其中, 所述记录单元用以记录用户查询数据,所述用户查询数据包括查询关键词、时间戳和查询结果; 所述计算单元用以基于查询结果计算实际有效查询率; 所述实际有效查询率为有效关键词占分词后总的关键词的数目的百分比; 所述判定单元用以根据标准有效查询率对实际有效查询率进行判定,以判定构建的知识图谱质量是否符合标准; 所述调整单元用以基于任一查询关键词的历史查询频率选择对模型设置参数或数据处理流程进行调整; 所述调整单元包括第一调整单元和第二调整单元,其中, 所述第一调整单元用以在历史查询频率大于标准查询频率时,将查询关键词存入社保数据库中进行储存; 所述第二调整单元用以在历史查询频率小于等于标准查询频率时,基于实际有效查询率的变化趋势调整模型的超参数,所述超参数为模型训练的批量大小; 其中,绘制实际有效查询率随时间的变化曲线,得到有效查询曲线,对有效查询曲线的斜率进行分析,若有效查询曲线的斜率小于标准斜率,增加批量大小。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人众合云科信息技术集团有限公司,其通讯地址为:100022 北京市朝阳区永安东里16号第12层01B单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。