东南大学杨鹏获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉东南大学申请的专利一种基于关键事件的多文档摘要生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117874220B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410055343.1,技术领域涉及:G06F16/34;该发明授权一种基于关键事件的多文档摘要生成方法是由杨鹏;吉顺航;李冰;易梦;孙元康设计研发完成,并于2024-01-15向国家知识产权局提交的专利申请。
本一种基于关键事件的多文档摘要生成方法在说明书摘要公布了:本发明公开了一种基于关键事件的多文档摘要生成方法,首先通过互联网采集同一主题下的多篇媒体文章,并在文档集合基础上按人工规则生成标准摘要构造出样本数据集;然后对数据集进行预处理,生成训练模型的输入数据;接着构建基于关键事件融合的序列到序列多文档摘要生成模型;最后基于训练完毕后的模型进行输出模型的构建,并利用输出模型对待进行摘要的文档集合进行自动摘要生成。本发明利用事件抽取技术提取出多个文档中的包含动静态信息的关键事件来挖掘出多篇文档的关系,能够多层次地对摘要生成过程进行引导,从而提高摘要结果的信息覆盖度与事实一致性,突出原文中的事件信息,增强摘要逻辑性。
本发明授权一种基于关键事件的多文档摘要生成方法在权利要求书中公布了:1.一种基于关键事件的多文档摘要生成方法,其特征在于,所述方法包括以下步骤: 步骤1:积累样本数据集, 步骤2:数据预处理, 步骤3:训练基于关键事件的多文档摘要生成模型, 步骤4,利用训练完毕的模型构建输出模型生成摘要; 其中,步骤3,利用步骤2处理后的数据集D对基于关键事件信息的多文档摘要生成模型进行训练,该步骤分为以下子步骤: 子步骤3-1,构建输入层,输入层接收关键事件序列与多文档序列作为输入,将每个词序列转化为词向量序列,其中事件向量把事件触发词与事件实体进行融合拼接后进行转化,分别得到映射后的关键事件向量序列、与多文档向量序列, 子步骤3-2,构建文本编码层,采用两个编码器分别对事件和文档进行编码,事件编码器采用传统的Transformer编码器,对关键事件向量序列进行语义编码提取,得到关键事件向量序列的隐层状态向量,文档编码器采用层次化的Transformer编码器来处理多个文档的编码,同时顾及单个文档内部的注意力计算与多个文档之间的关系建模,通过公式12对多文档按照文档层级和单词层级进行编码,把每一层的文本序列输入进行残差连接计算,而后利用多头池化技术通过公式3获得统一维度的文档向量序列的隐层状态向量,再由公式4所示,通过交互注意力机制来对多个文档之间的关系进行建模,把其它文档的信息融入文档自身,得到获得新的文档表示,并再次通过残差网络计算得到最终的文本序列表示, 子步骤3-3,构建事件感知的图注意力层,采用一层图注意力网络,把文档和事件表示作为图的结点,事件是否存在于文档中作为边,通过多头注意力池化过获得相同长度的事件和文档进行注意力计算,通过一个以LeakyReLU为激活函数的线性变换,把图的结点和边进行结合得到,再通过公式5进行图注意力系数的计算得到,最后通过公式6经过一层以sigmoid为激活函数的线性变换计算融合结点和边信息获得融入了关键事件信息的事件感知的文档表征, 子步骤3-4,构建摘要解码层,采用一个层次化的Transformer解码器进行摘要的解码,首先进入Transformer解码层之后,把关键事件序列的隐层状态向量作为查询向量Query与解码器的已解码摘要进行注意力计算得到事件指针,然后通过公式7利用得到的事件指针进行指导,与待解码的文本表示再进行进行注意力计算得到,最后通过一层线性变换,通过公式8利用LeakyReLU激活函数得到解码的最终输出表征,公式如下: 子步骤3-5,构建摘要概率化层,使用一个线性映射函数与softmax激活函数,将解码层隐状态向量转化为摘要词的预测概率分布P,计算公式9如下所示: 其中,和是模型待训练的参数, 子步骤3-6,训练所述模型,采用随机初始化的方式初始化所有待训练参数,在训练过程中采用Adam优化器进行梯度反向传播来更新模型参数,初始学习率设置为0.001,集束搜索设置为5,当训练损失不再下降或训练轮数超过100轮时,模型训练结束。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人东南大学,其通讯地址为:211102 江苏省南京市江宁区东南大学路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励