清华大学段智超获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉清华大学申请的专利基于跨语言的自动问答、模型训练方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114265922B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111395477.0,技术领域涉及:G06F16/3329;该发明授权基于跨语言的自动问答、模型训练方法及设备是由段智超;李秀星;李振宇;王建勇设计研发完成,并于2021-11-23向国家知识产权局提交的专利申请。
本基于跨语言的自动问答、模型训练方法及设备在说明书摘要公布了:本发明提供一种基于跨语言的自动问答、模型训练方法及设备,其中的方法包括:获取问题和文本,文本的语言不同于问题的语言;将问题和文本输入至自动问答模型,得到自动问答模型输出的文本中问题的答案的位置信息;其中,自动问答模型是基于问题样本及包含问题样本的答案的文本样本,对包含知识增强的预训练模型的预设模型进行训练得到的,知识增强的预训练模型是基于利用知识图谱构建的多个多元组,对初始的预训练模型进行预训练得到的,能够学习到跨语言的知识以建立不同语言之间的对应关系,从而使得知识增强的预训练模型的推理能力和对不同语言的理解能力得到了增强,进而实现了自动问答模型对跨语言的问答的性能的提升。
本发明授权基于跨语言的自动问答、模型训练方法及设备在权利要求书中公布了:1.一种基于跨语言的自动问答方法,其特征在于,包括: 获取问题和文本,所述文本的语言不同于所述问题的语言; 将所述问题和所述文本输入至自动问答模型,得到所述自动问答模型输出的所述文本中所述问题的答案的位置信息; 其中,所述自动问答模型是基于问题样本及包含所述问题样本的答案的文本样本,对包含知识增强的预训练模型的预设模型进行训练得到的,所述知识增强的预训练模型是基于利用知识图谱构建的多个多元组,对初始的预训练模型进行预训练得到的; 多个所述多元组包括第一类多元组、第二类多元组和第三类多元组;所述第一类多元组中的每个所述多元组包括多种语言中的同种语言表达的头实体、关系和尾实体;所述第二类多元组中的每个所述多元组包括所述多种语言中的一种语言表达的头实体、与头实体或者尾实体相同种类的语言表达的关系和与头实体不同种类的语言表达的尾实体;所述第三类多元组中的每个所述多元组包括所述多种语言中的一种语言表达的头实体、关系和尾实体,以及另一种语言表达的头实体、关系和尾实体; 所述知识增强的预训练模型的预训练过程包括:针对每个所述多元组,将所述多元组输入至所述初始的预训练模型,训练所述初始的预训练模型输出所述多元组中各语言表达的头实体,以及,将所述多元组输入至所述初始的预训练模型,训练所述初始的预训练模型输出所述多元组中各语言表达的尾实体; 所述将所述多元组输入至所述初始的预训练模型,训练所述初始的预训练模型输出所述多元组中各语言表达的头实体,以及,将所述多元组输入至所述初始的预训练模型,训练所述初始的预训练模型输出所述多元组中各语言表达的尾实体,包括: 将所述多元组输入至所述初始的预训练模型,掩蔽所述多元组中各语言表达的头实体,训练所述初始的预训练模型输出所述多元组中各语言表达的头实体; 将所述多元组输入至所述初始的预训练模型,掩蔽所述多元组中各语言表达的尾实体,训练所述初始的预训练模型输出所述多元组中各语言表达的尾实体。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人清华大学,其通讯地址为:100084 北京市海淀区双清路30号清华大学;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励