人民中科(北京)智能技术有限公司李艳鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉人民中科(北京)智能技术有限公司申请的专利一种用于多轮对话式问答的检索增强方法、系统及应用获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121029952B 。
龙图腾网通过国家知识产权局官网在2026-02-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511557092.8,技术领域涉及:G06F16/3329;该发明授权一种用于多轮对话式问答的检索增强方法、系统及应用是由李艳鹏;张朝;张欣设计研发完成,并于2025-10-29向国家知识产权局提交的专利申请。
本一种用于多轮对话式问答的检索增强方法、系统及应用在说明书摘要公布了:本发明属于智能对话技术领域,提供了一种用于多轮对话式问答的检索增强方法、系统及应用,通过构建含咨询问题、文档、答案及改写检索文本的四元组数据集,结合对话状态缓存与混合检索策略,利用Rewriter模型生成以检索任务为主要导向的改写文本,根据改写后的文本,动态挖掘新的难例,结合生成损失函数和多正样本对比损失函数构建联合损失函数,联合优化Rewriter模型。本发明提出多正样本对比损失函数以充分利用多轮数据集中的监督信号,提高改写模型对上下文的理解能力;提出了动态难例挖掘方法,在训练过程中根据改写结果实时做动态挖掘,以解决无法根据检索反馈实时优化改写查询的问题。
本发明授权一种用于多轮对话式问答的检索增强方法、系统及应用在权利要求书中公布了:1.一种用于多轮对话式问答的检索增强方法,其特征在于,所述方法包括: 1数据集构建:构建可模拟对话问答流程的数据构造器,以领域知识文档作为数据源,输出包括四元组数据的数据集,所述四元组数据包括咨询问题、相关文档、答案和改写后检索文本; 2对话状态管理:对用户与问答系统的历史对话数据进行缓存,设置最大缓存长度N,仅存储最近N轮用户输入,不存储问答系统响应结果; 3初始化检索:基于当前对话输入及历史对话拼接结果,采用关键词检索与向量检索集成的混合检索策略获取首次检索结果; 4检索导向的查询改写:将当前对话输入、历史对话及首次检索结果拼接为文本,输入至Rewriter模型进行改写,生成以检索任务为主要导向的改写文本; 5生成损失计算:基于改写文本和数据集中目标改写的检索文本构建生成损失函数,计算Rewriter模型的生成损失; 6动态难例挖掘:对改写文本进行向量检索,对召回文档片段进行过滤,以数据集中与查询文本相关的文档片段为正样本,以数据集中与查询文本不相关的文档片段为负样本,保留高相关且不属于正样本的负样本; 7文档检索损失计算:基于改写文本、正样本及动态挖掘的负样本构建多正样本对比损失函数,计算Rewriter模型的文档检索损失; 所述多正样本对比损失函数表示为: ; 表示相似度计算函数,计算公式如下: ; 其中,表示批次大小,表示查询文本对应的正样本数量,表示查询文本对应的负样本数量,表示查询文本,表示数据集中的文档片段,表示正样本,表示负样本; 8联合训练:结合生成损失函数和多正样本对比损失函数构建联合损失函数,联合优化Rewriter模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人人民中科(北京)智能技术有限公司,其通讯地址为:100086 北京市海淀区知春路68号领航科技大厦1401;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励