苏州大学钱子杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州大学申请的专利一种篇章级事件事实性检测方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119621977B 。
龙图腾网通过国家知识产权局官网在2026-04-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411503598.6,技术领域涉及:G06F16/353;该发明授权一种篇章级事件事实性检测方法及系统是由钱子杰;钱忠设计研发完成,并于2024-10-25向国家知识产权局提交的专利申请。
本一种篇章级事件事实性检测方法及系统在说明书摘要公布了:本发明公开了一种篇章级事件事实性检测方法及系统,方法包括:获取包含事件描述的标题和对应正文文本的语料库;对语料库进行翻译后抽取主要事件和关键元素的信息;将抽取的双语信息进行编码,并采用基于图注意力网络的改进模型将编码后的双语信息作为全局节点与正文文本进行连接;通过网格搜索调整中英文文本的权重;利用数据增强的数据集确定标题中事件事实性的检测结果。本发明在数据预处理前通过数据增强获得关键信息以提高模型的准确性和效率,多语言表示可以得到相同文本的在多语言上不同敏感程度的表达;而且本发明应用图模型中的GAT模型,将提取的关键信息作为全局节点与整个文本相结合,使得模型的性能更好,鲁棒性更强。
本发明授权一种篇章级事件事实性检测方法及系统在权利要求书中公布了:1.一种篇章级事件事实性检测方法,其特征在于,包括: 获取包含事件描述的标题和对应正文文本的语料库; 对所述语料库进行翻译后抽取主要事件和关键元素的信息; 将抽取的双语信息进行编码,并采用基于图注意力网络的改进模型将所述编码后的双语信息作为全局节点与正文文本进行连接; 通过网格搜索调整中英文文本的权重,以获取数据增强的数据集; 利用所述数据增强的数据集确定标题中事件事实性的检测结果; 所述将抽取的双语信息进行编码包括: 抽取英文语料库和中文语料库中的主要事件和关键元素,所述关键元素为从所述主要事件中提取的主语、动词和宾语; 采用分割策略对文本长度超过第一阈值的文本进行分片处理; 选择适用于长文本处理的Longformer编码器对经过预先抽取和所述分片处理的双语文本进行编码,生成固定长度的向量表示,并将所述固定长度的向量表示输入所述基于图注意力网络的改进模型中; 所述采用基于图注意力网络的改进模型将所述编码后的双语信息作为全局节点与正文文本进行连接包括: 构建包含主事件节点、句子节点、单词节点以及所述关键元素变为的全局节点的关系图,并定义各个节点之间的连接; 采用基于图注意力网络的改进模型更新节点表示,每个节点在更新其表示时,根据其与邻居节点之间的关系强度重新赋予权重,即与所述全局节点紧密相关的句子节点会被赋予更高的权重,将更新后的全局节点作为第一个节点依次添加文本中的句子,进而完成与所述正文文本的连接; 所述通过网格搜索调整中英文文本的权重,以获取数据增强的数据集包括: 设置表示中文文本相对于英文文本的重要性的权重比值,基于所述权重比值创建网格,其中所述网格中的每一格对应一个特定的权重组合; 对于网格中的每一对权重,使用相应的比例重新加权文本特征并训练模型,在每一次训练后使用验证集上的预定评估标准衡量模型的性能; 从所有权重组合中挑选使得模型表现最优的权重比值,根据所述使得模型表现最优的权重比值调整中英文文本的权重比例,以最大程度保留原始英文文本的信息; 对所述语料库进行翻译后抽取主要事件和关键元素的信息包括: 将获取的包含事件描述的标题和对应正文文本的英文语料库进行翻译形成中文语料库,抽取所述英文语料库和中文语料库中的主要事件和关键元素,所述关键元素为从所述主要事件中提取的主语、动词和宾语。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州大学,其通讯地址为:215000 江苏省苏州市吴江区久泳西路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励