复旦大学邱锡鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉复旦大学申请的专利一种基于标签平滑的多跳回答问题框架获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117909441B 。
龙图腾网通过国家知识产权局官网在2026-02-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211232474.X,技术领域涉及:G06F16/3329;该发明授权一种基于标签平滑的多跳回答问题框架是由邱锡鹏;汪燠欣;印张悦;吴驿光设计研发完成,并于2022-10-10向国家知识产权局提交的专利申请。
本一种基于标签平滑的多跳回答问题框架在说明书摘要公布了:本发明目的在于提供一种基于标签平滑的多跳回答问题框架,用于缓解模型的过分自信以及答案边界的不确定问题。本发明提供了一种基于标签平滑的多跳回答问题框架,包括:步骤S1,输入问题和候选文章列表粗筛得到3篇待选文章;步骤S2,通过对3篇待选文章两两分组的方式组成3个配对,再一次通过细筛的方式选择最优配对;步骤S3,将选出的最优配对的两篇文章以及问题一起输入模型,通过预训练语言模型回答问题。
本发明授权一种基于标签平滑的多跳回答问题框架在权利要求书中公布了:1.一种基于标签平滑的多跳回答问题框架,用于缓解模型的过分自信以及答案边界不确定的问题,其特征在于,包括以下步骤: 步骤S1,输入问题和候选文章列表粗筛得到3篇待选文章; 步骤S2,通过对所述3篇待选文章两两分组的方式组成3个配对,再一次通过细筛的方式选择最优配对的两篇文章;以及 步骤S3,将选出的所述最优配对的两篇文章以及所述问题一起输入模型,通过预训练语言模型回答问题, 其中,在所述步骤S1中,利用已知正确的候选文章构造出经验风险损失的函数,其表达式为: 式中,wi表示对单个样本中第i个候选文章损失函数的权重,如果该文章包含最终的答案,那么为2,剩下的权重为1,E表示对所有样本取期望,M表示单个样本对应的候选文章数量,Li表示第i个候选文章是否筛选的损失函数,具体表示为: 式中,表示第i个文章是否是正确的候选文章之一,如果是,则为1,如果不是则为0,表示模型预测第i个文章是正确的候选文章之一的概率,log表示自然对数,其中,可以通过标签平滑手段对进行平滑化处理,即表示为当第i个文章是正确的候选文章之一时为0.9,若不是,则为0.1, 所述步骤S3包括以下子步骤: 步骤S3-1,将输入的两篇文章拼接后进行序列化; 步骤S3-2,将处理好的序列输入预训练模型进行特征提取; 步骤S3-3,采用阅读理解模型提取答案的开始位置和结束位置; 步骤S3-4,根据获取到的开始位置和结束位置,根据原始文本还原成答案进行输出, 其中,所述步骤S3训练时采用的经验风险损失的函数为: 式中,表示开始位置模型预测的概率分布,表示结束位置模型预测的概率分布,表示正确的开始位置的分布,即只有正确的开始位置为1,其余位置为0,表示正确的结束位置的分布,即只有正确的结束位置为1,其余位置为0, 所述步骤S3中,为更好地避免模型过分自信的问题,采用F1Smoothing的方式修正和修正公式为: 式qsi中,表示修正后的开始位置概率分布,qei表示修正后的结束位置概率分布,F1表示F1分数,agold表示正确的答案。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人复旦大学,其通讯地址为:200433 上海市杨浦区邯郸路220号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励