中国科学院自动化研究所曹志冬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院自动化研究所申请的专利针对非连续实体的实体关系联合抽取方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118551764B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411028372.5,技术领域涉及:G06F40/295;该发明授权针对非连续实体的实体关系联合抽取方法及装置是由曹志冬;于春淼;罗天怡;王姣姣;曾大军;费佳强;张翔宇设计研发完成,并于2024-07-30向国家知识产权局提交的专利申请。
本针对非连续实体的实体关系联合抽取方法及装置在说明书摘要公布了:本发明提供一种针对非连续实体的实体关系联合抽取方法及装置。该方法属于信息抽取和自然语言处理技术领域,包括:利用实体关系抽取模型预测待处理文本中每两个字符间的关系;对实体关系抽取模型的训练,首先将训练文本中的每两个字符作为字符组合存储在表格中,并对表格中的字符组合进行字符间关系的标注;利用该模型中的空洞卷积层和联合分类器对字符组合进行字符间关系标签的预测;基于真实标签信息和预测标签信息计算损失来训练该模型。本发明提供的针对非连续实体的实体关系联合抽取方法及装置,利用空洞卷积和联合分类器对字符组合构成的表格进行标签预测,实现了对非连续实体关系的联合抽取,提高了模型在复杂场景的适应能力。
本发明授权针对非连续实体的实体关系联合抽取方法及装置在权利要求书中公布了:1.一种针对非连续实体的实体关系联合抽取方法,其特征在于,包括: 获取待处理文本; 利用实体关系抽取模型预测所述待处理文本中每两个字符间的关系; 其中,所述实体关系抽取模型是通过以下步骤训练获得的: 将训练文本中的每两个字符作为字符组合存储在表格中,并对所述表格中的字符组合进行字符间关系的标注,得到真实标签信息; 利用实体关系抽取模型中的空洞卷积层和联合分类器对所述字符组合进行字符间关系标签的预测,得到预测标签信息; 基于所述真实标签信息和所述预测标签信息计算损失并基于所述损失训练实体关系抽取模型; 所述利用实体关系抽取模型中的空洞卷积层和联合分类器对所述字符组合进行字符间关系标签的预测,得到预测标签信息,包括: 基于字符组合对应的上下文信息、字符间的距离信息以及字符间的相对位置关系信息获取字符组合的联合编码; 基于所述字符组合的联合编码并利用不同膨胀率的空洞卷积层获取不同尺度的输出,并将不同尺度的输出进行拼接得到卷积层输出; 将所述卷积层输出输入至所述联合分类器中,获得字符组合的预测标签信息; 所述字符间关系标签包括: 第一标签,用于指示两个字符间属于同一个实体并在实体中相连; 第二标签,用于指示两个字符属于同一个实体并在实体中处于首尾的位置; 第三标签,用于指示两个字符属于不同实体且两个字符在两个实体中处于末尾的位置; 所述基于字符组合对应的上下文信息、字符间的距离信息以及字符间的相对位置关系信息获取字符组合的联合编码,包括: 对字符组合对应的上下文信息进行条件层归一化,得到字符组合的语义联合编码; 将字符间的距离信息映射为字符间距低维向量,并将字符间的相对位置关系信息映射为字符相对位置关系低维向量; 将所述字符组合的语义联合编码、所述字符间距低维向量和所述字符相对位置关系低维向量进行拼接,并将拼接后的向量通过多层感知机获得字符组合的联合编码。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院自动化研究所,其通讯地址为:100190 北京市海淀区中关村东路95号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励