复旦大学魏忠钰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉复旦大学申请的专利反论点生成模型,模型的训练和推理方法、基于大模型的评价标准获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117407589B 。
龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311418867.4,技术领域涉及:G06F16/9535;该发明授权反论点生成模型,模型的训练和推理方法、基于大模型的评价标准是由魏忠钰;林嘉昱设计研发完成,并于2023-10-30向国家知识产权局提交的专利申请。
本反论点生成模型,模型的训练和推理方法、基于大模型的评价标准在说明书摘要公布了:本发明的目的是提供一种句级别反论点生成任务的模型和评价方法,适应任务的模型、以及新的评价标准,所述方法包括:在训练阶段,运用论辩类指令对大语言模型进行低秩指令微调,运用人类偏好数据训练评分模型;在推理阶段,通过思维链形式的指令引导大语言模型对输入进行错误检测;进一步基于错误类型借助大语言模型实现反论点生成;最终利用预先训练的评分模型对候选输出进行打分,筛选后得到系统输出。该方法构造了一个思维链提示‑反论点生成‑筛选的管道式推理框架,能够有效地识别论点中存在的主要错误并生成有逻辑性、针对性的反论点。
本发明授权反论点生成模型,模型的训练和推理方法、基于大模型的评价标准在权利要求书中公布了:1.一种针对句级别反论点生成方法,其特征在于,应用于对话题-原论点对输入进行处理实现反论点输出,所述方法包括: 获取话题-原论点; 将根据话题-原论点获取到的话题以及原论点以及使用思维链形式提示的思维链错误在大语言模型结合,从而生成多个与所述思维链错误相关的候选论点,包括:将获取到的话题和原论点分别填充入与多个错误类型对应的各个指令模板构成完整的论辩指令,通过分词器得到指令的词序列,再将词序列输入到大语言模型中生成若干个候选论点; 通过评分模型对多个候选论点进行评分并排序,从而筛选出最优的反论点,包括:将单个候选论点与原论点用特殊字符“[SEP]”隔开后拼接成一段文本,将该段文本分词后得到相应的词序列; 将分词得到的词序列输入模型获取词嵌入后,对词嵌入作平均池化以及正则化、线性变换以获取最终得分; 其中,针对反论点生成的评分方法,包括以下步骤: 基于语段中人工产出的标注数据,评分模型按照预先设定的规则构造出符合人类偏好的排序数据,“构造符合人类偏好排序数据”步骤中包括:从原始句-段落对的论坛交流语料中抽取句对,其中,将段落按照整句分隔符划分成若干个句子,由标注员标注所划句子是否与原始句构成反驳关系;针对每个原始句,构造多个句子形成排序数据,其中,顺序分别是同语对被勾选的某个句子、同语对未被勾选的某个句子、无信息量的安全回复以及不同语对的某个句子;在训练评分模型的过程中,针对多个句子,按顺序分配了递增的排序分;将多个所述句子分别与原论点进行拼接,形成模型的输入;使用基于排序分的有监督训练方式,对评分模型进行训练; 基于所述排序数据,所述评分模型采用List-Wise算法作为优化目标的排序算法,对大语言模型进行有监督的训练;其中,在所述评分模型的训练过程中,使用给定的排序分作为标签,通过比较模型生成的论点和人类偏好排序的参考结果,优化模型的参数和学习算法,使其能够更好地生成符合人类偏好的排序结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人复旦大学,其通讯地址为:200433 上海市杨浦区邯郸路220号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励