西安电子科技大学付小洪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安电子科技大学申请的专利一种基于多特征融合的中文事件触发词抽取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116521839B 。
龙图腾网通过国家知识产权局官网在2026-03-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310400801.6,技术领域涉及:G06F16/3329;该发明授权一种基于多特征融合的中文事件触发词抽取方法是由付小洪;姬红兵;张文博;李林;臧博设计研发完成,并于2023-04-14向国家知识产权局提交的专利申请。
本一种基于多特征融合的中文事件触发词抽取方法在说明书摘要公布了:本发明公开了一种基于多特征融合的中文事件触发词抽取方法,包括以下步骤;S1:获取中文事件抽取数据集;S2:搭建基于多特征融合的中文事件触发词抽取网络,该网络包括文本编码层、特征融合层和检测分类层;S3:将S1所得数据经过处理后输入到S2搭建的基于多特征融合的中文事件触发词抽取网络中,训练中文事件触发词抽取网络;S4:将待抽取的中文文本,输入到训练好的中文事件触发词抽取网络中进行触发词抽取,输出文本触发词的检测结果。本发明通过抽取输入文本的事件触发词,利用卷积神经网络和注意力机制充分融合上述特征。获取文本的深层语义信息,从而提高事件触发词抽取的精确率、召回率和F1值。
本发明授权一种基于多特征融合的中文事件触发词抽取方法在权利要求书中公布了:1.一种基于多特征融合的中文事件触发词抽取方法,其特征在于,包括以下步骤; S1:获取中文事件抽取数据集,该数据集由大量中文文本组成,并标注出最能代表文本语义的触发词位置; S2:搭建基于多特征融合的中文事件触发词抽取网络,该网络包括文本编码层、特征融合层和检测分类层,其中所述文本编码层用于得到BERT字级别特征、远程监督触发词特征、分词特征和词性特征; S3:将S1所得数据经过处理后输入到S2搭建的基于多特征融合的中文事件触发词抽取网络中,训练中文事件触发词抽取网络; S4:将待抽取的中文文本,输入到训练好的中文事件触发词抽取网络中进行触发词抽取,输出文本触发词的检测结果; 所述S2中,按照各层之间的连接顺序依次为: S201:文本编码层用于负责提取输入文本的BERT字级别特征、远程监督触发词特征、分词特征和词性特征; S201a:将S201输入文本进行BERT的分词器分词后,输入到BERT的预训练模型获得BERT字向量,该字向量由词嵌入、段嵌入和位置嵌入三部分组合而成; S201b:采用K折交叉验证的方式构建远程监督知识库,以此排除自身标签的影响;将输入文本与构建的远程监督知识库比对,找到输入文本的远程监督触发词;使用One-hot进行编码,经由Embedding获得输入文本的远程监督触发词特征; S201c:首先,使用爬虫技术在新闻类网站上分别获取军事、金融、政治、社会、体育、科技、娱乐、司法、灾害事故类别的文本; 其次,使用外部工具jieba对获取到的文本进行分词处理,并按照词频排序以制作中文词典; 最后,使用jieba对输入文本进行分词操作,根据中文词典中的词语顺序得到向量表示,经由Embedding获得输入文本的分词特征; S201d:使用外部工具jieba分析S201输入文本词性,找到文本对应位置的动词并将其对应位置One-hot向量置为1,编码后输入到Embedding层获得输入文本的词性特征; S201a、S201b、S201c、S201d都是以S201输入文本分别得到BERT字级别信息、远程监督触发词信息、分词信息和词性信息; S202:特征融合层用于负责将抽取到的各类信息进行局部特征提取与融合,获取深层语义信息; S202a:使用卷积神经网络融合S201b、S201c和S201d的词向量,提取输入文本的局部特征信息; S202b:使用注意力机制将S202a与S201a的字向量按照一定比例融合,得到融合后特征,捕捉输入文本中更为关键的信息; S203:检测分类层,负责将S202b所得融合后特征用于事件触发词抽取任务,得到最终抽取结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学,其通讯地址为:710071 陕西省西安市雁塔区太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励