南京吾道知信信息技术有限公司王俊获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京吾道知信信息技术有限公司申请的专利一种多模态金融文档的事件抽取方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114881015B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210477716.5,技术领域涉及:G06F40/279;该发明授权一种多模态金融文档的事件抽取方法和系统是由王俊;陈玉婷;徐阳春;侯启予;向俊夫设计研发完成,并于2022-05-05向国家知识产权局提交的专利申请。
本一种多模态金融文档的事件抽取方法和系统在说明书摘要公布了:本发明公开了一种多模态金融文档的事件抽取方法和系统,属于数据处理技术领域,所述方法包括:获取待抽取区域及其对象,所述对象包括表格和文本;对所述表格进行解析,获得表格的内容,所述内容包括事件和论元;根据所述表格的事件筛对所述文本进行筛选,获得相关句子;从所述相关句子中提取论元角色和或补充论元。从半结构化表格进行相对容易的信息抽取,然后利用从表格中获取的信息来辅助和改进从文本信息抽取,提高抽取效率和可靠性;可以将表格和文本中抽取的信息互相补充,得到更完整的信息抽取结果。
本发明授权一种多模态金融文档的事件抽取方法和系统在权利要求书中公布了:1.一种多模态金融文档的事件抽取方法,其特征在于,所述方法包括: 获取待抽取区域及其对象,所述对象包括表格和文本; 对所述表格进行解析,获得表格的内容,所述内容包括事件和论元; 根据所述表格的事件筛对所述文本进行筛选,获得相关句子; 从所述相关句子中提取论元角色和或补充论元; 其中,所述表格的内容包括实体,从所述相关句子中提取论元角色的方法包括:将表格的实体与所述相关句子进行匹配获得论元角色和论元提及; 其中,获得相关句子的方法包括:根据表格的内容或表格的标题,获得所述表格的事件;通过句子文本分类器,获得所述句子的分类;根据所述事件和分类,对句子进行筛选; 其中,从相关句子中提取补充论元的方法包括:句子分类过滤方法、序列标注方法或机器学习的方法,所述机器学习的方法包括基于预训练语言模型的序列标注法、基于预训练语言模型的机器阅读理解法或Prompt法; 基于预训练语言模型的序列标注法包括:通过预训练语言模型对实体进行编码,获得第一编码;在所述第一编码中,加入实体类型的向量,获得第二编码;通过预训练语言模型对相关句子进行编码,获得第三编码;在第三编码的与所述实体匹配部分的中,加上实体类型编码;对相关句子中未匹配部分,进行标注后,利用序列标注的方法获得补充论元; 基于预训练语言模型的机器阅读理解法包括:将补充论元抽取问题定义为一个问答问题;基于所述问答问题,在所述句子中找出所述问题的答案,获得补充论元; Prompt法为将事件论元的抽取问题定义为一个通过seq2seq的方式直接产生答案的方法。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京吾道知信信息技术有限公司,其通讯地址为:211100 江苏省南京市江宁区东麒路33号东山国际企业总部园E座307;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励