四川大学何小海获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉四川大学申请的专利一种基于机器阅读理解模型的事件抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115905458B 。
龙图腾网通过国家知识产权局官网在2025-08-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111168223.5,技术领域涉及:G06F16/334;该发明授权一种基于机器阅读理解模型的事件抽取方法是由何小海;刘露平;周欣;卿粼波;魏鑫;吴小强;滕奇志设计研发完成,并于2021-09-30向国家知识产权局提交的专利申请。
本一种基于机器阅读理解模型的事件抽取方法在说明书摘要公布了:本发明公开了一种基于机器阅读理解模型的事件抽取方法。该方法将事件抽取的两个子任务:事件检测和事件元素提取都建模成机器阅读理解任务,并采用多轮问答的方式来抽取出事件的完整信息。本发明通过使用BERT预训练模型来构建机器阅读理解框架。为了使模型能学习到句子中的实体信息,在输入句子中对句子中的实体进行显式地标记。此外还构建了历史会话信息编码模块,并采用注意力机制从历史会话中捕获重要信息以辅助当前轮次的问答。相比于现有方法,本发明方法能更好的利用先验知识来辅助进行事件抽取,在自动文摘、自动问答以及事理图谱构建等方面具有广阔应用前景。
本发明授权一种基于机器阅读理解模型的事件抽取方法在权利要求书中公布了:1.一种基于机器阅读理解模型的事件抽取方法,其特征在于包括以下步骤: 步骤一:首先根据问题模板构造触发词抽取问题; 步骤二:对输入句子中的实体信息进行显式的标记; 步骤三:将步骤一中的生成的问题和步骤二得到的句子进行拼接后送入到机器阅读理解模型后抽取出触发词; 步骤四:针对步骤三中抽取的触发词,进一步根据问题模板构造事件类型抽取问题; 步骤五:将所有的事件类型以标识符“[EVENT_TYPE]”进行拼接到步骤二中得到的句子后形成新的输入段落,然后进一步将其拼接到步骤四中生成的问题后输入到机器阅读理解模型后抽取出相应的事件类型; 步骤六:根据触发词和事件的角色进一步构造事件角色元素抽取问题,然后将步骤二中得到的句子拼接到生成的问题后,输入到融合历史会话信息的阅读理解模型抽取出相应的事件角色元素; 步骤七:重复步骤三继续抽取新的事件信息,直到句子中所有的事件抽取完成;其中机器阅读理解模块用于事件信息的抽取,而历史会话信息模块则用于对历史问答会话中的答案句子进行编码,在进行特征融合时,按如下步骤进行: a首先将历史问答对中的答案句子分别在开始和结尾处加上“[CLS]”和“[SEP]”标志位后送入到BERT模型进行编码得到相应的句子表示,计算形式如下: 上式中,Ai'表示第i轮次答案句子经过拆分后的序列,而和为则为编码后得到的句子特征向量表示; b随后,通过点乘注意力计算每个历史问答对中的答案句子与当前轮次问答的关联度得分,注意力权重系数的计算形式如下: 式中,为映射矩阵,为第i轮次问答对中的答案句子所对应的注意力权重; c接着,根据注意力权重,对所有轮次答对中的答案句子的特征向量表示进行加权求和后得到整个历史会话信息的特征表示ch: d最后在获得历史会话信息的特征表示ch后依次将其与阅读理解模型输出的每个单词的特征向量经过级联后得到融合后的特征向量: 上式中ccls,cq1,...,cqn,c[sep],cd1,...,cdm,csep即为融合了历史会话信息的单词特征向量表示。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610065 四川省成都市武侯区一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。