天道金科股份有限公司;浙江浙里信征信有限公司李响获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉天道金科股份有限公司;浙江浙里信征信有限公司申请的专利基于文本分类的候选段落生成及多跳问题回答方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115878794B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211229355.9,技术领域涉及:G06F16/353;该发明授权基于文本分类的候选段落生成及多跳问题回答方法是由李响;陈晓旭;魏忠钰;王思远设计研发完成,并于2022-10-08向国家知识产权局提交的专利申请。
本基于文本分类的候选段落生成及多跳问题回答方法在说明书摘要公布了:本发明公开了一种基于文本分类的候选段落生成及多跳问题回答方法,属于自然语言处理技术领域。本发明基于提示语言对段落文本分类为原始问题的候选段落,并通过提供中间跳推理器,使得每个推理步骤基于当前的支持事实,产生了更准确的问题分解;通过提供单跳问题生成器,利用现成的单跳问题数据集来训练一个单跳问题生成器,直接以无监督的方式生成子问题,不再需要对问题分解后进行人工标注,且避免了伪监督可能引入标签噪声的风险;另外,将用于训练单跳问题生成器的单跳问题数据集同样作为单跳问答模型训练的样本之一,使得单跳问答模型与单跳问题生成器所使用的数据更加一致,有利于提升单跳问答模型的预测性能。
本发明授权基于文本分类的候选段落生成及多跳问题回答方法在权利要求书中公布了:1.一种基于文本分类的候选段落生成及多跳问题回答方法,其特征在于,步骤包括: S1,提取原始问题中的关键词并打上标签; S2,对于给定的段落文本,使用模板函数将转换为语言模型的输入,在原始的所述段落文本中增加了分类任务的提示语言,所述提示语言中包含需要预测并填写标签的掩码位置; S3,所述语言模型预测出填入所述掩码位置的标签; S4,标签转换器将所述标签映射为事先构建的标签体系的标签词集合中对应的标签词作为预测得到的所述段落文本的类型; S5,判断所述标签词与所述标签是否一致, 若是,则将所述段落文本作为回答所述原始问题的候选段落加入到候选段落集中, 若否,则过滤掉所述段落文本; S6,将所述原始问题输入到预先训练的段落排序模型中计算得到表征所述候选段落集中的每个所述候选段落与解答所述原始问题具有的相关性的概率得分,然后选取得分排名前的所述候选段落以及排名第一的所述候选段落链接的跳转段落作为解答所述原始问题的相关上下文,记为; S7,将所述原始问题、相关上下文以及前一中间跳得到的子问题-答案对输入到以每一跳的输入输出数据为训练样本迭代更新训练的统一阅读器模型中进行中间跳答案推理,输出当前中间跳对应的子问题-答案对和单跳支持句; S8,以最终跳的前一跳输出的子问题-答案对、所述原始问题、所述相关上下文以及预设的答案类型为所述统一阅读器模型的输入进行最终跳的答案推理,输出所述原始问题对应的多跳问题答案和多跳支持句。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天道金科股份有限公司;浙江浙里信征信有限公司,其通讯地址为:310000 浙江省杭州市下城区环城北路165号汇金国际大厦D幢1201室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。