宁波特斯联信息科技有限公司严鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉宁波特斯联信息科技有限公司申请的专利一种基于检索增强生成的大语言模型微调及评测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120910281B 。
龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511456625.3,技术领域涉及:G06F16/38;该发明授权一种基于检索增强生成的大语言模型微调及评测方法是由严鹏;梁树贤;林旸;赵莹臣;曾怡瑞;龚日晴;华先胜设计研发完成,并于2025-10-13向国家知识产权局提交的专利申请。
本一种基于检索增强生成的大语言模型微调及评测方法在说明书摘要公布了:本公开涉及人工智能技术领域,提供了一种基于检索增强生成的大语言模型微调及评测方法,该方法包括:根据预设字符级别切分规则将输入的原始文本文档内容切分为多个独立段落;从多个独立段落中提取实体及实体间关系,构建知识图谱;基于知识图谱,通过噪音采样模块、复杂归因模块、拒绝分析模块和思维推理模块分别生成噪音数据、复杂数据、拒绝数据和多跳数据;将噪音数据、复杂数据、拒绝数据、多跳数据和通用数据进行格式转换,得到微调数据;根据微调数据对大语言模型进行微调,得到微调后的检索增强生成模型;根据答案相关性指标和答案相似度指标对微调后的检索增强生成模型进行评测,提高了检索增强生成模型的准确性、可靠性和推理能力。
本发明授权一种基于检索增强生成的大语言模型微调及评测方法在权利要求书中公布了:1.一种基于检索增强生成的大语言模型微调及评测方法,其特征在于,包括: 根据预设字符级别切分规则将输入的原始文本文档内容切分为多个独立段落; 从所述多个独立段落中提取实体及实体间关系,构建知识图谱; 基于所述知识图谱,通过噪音采样模块、复杂归因模块、拒绝分析模块和思维推理模块分别生成噪音数据、复杂数据、拒绝数据和多跳数据,具体包括: 基于知识图谱中的实体及实体间关系构建第一简单问答对,从独立段落集合中筛选与第一简单问答对相关的段落信息,将其作为噪音信息按照预设比例加入所述第一简单问答对,形成噪音数据; 从知识图谱中选取M个具有相似属性或关系的实体构成实体簇,基于所述实体簇构建复杂问答对,形成复杂数据; 基于知识图谱中的实体和包含明确答案的绝对段落构建第二简单问答对,从独立段落集合中筛选除所述绝对段落外的其他段落作为第二问答对的相关文本,形成拒绝数据; 在知识图谱中筛选桥接实体,基于所述桥接实体及关联实体生成包含三个实体关系的候选段落对构建多跳问答对,形成多跳数据,其中,所述桥接实体同时与至少另外两个实体关联,且关联实体间不存在直接关系; 将所述噪音数据、复杂数据、拒绝数据、多跳数据和通用数据进行格式转换,得到微调数据,其中,所述通用数据为开源模型预训练所用问答数据; 根据所述微调数据对大语言模型进行微调,得到微调后的检索增强生成模型; 根据答案相关性指标和答案相似度指标对所述微调后的检索增强生成模型进行评测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人宁波特斯联信息科技有限公司,其通讯地址为:315475 浙江省宁波市余姚市中意宁波生态园兴滨路5号(邻里中心)3-2-441;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励