Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 太保科技有限公司任君翔获国家专利权

太保科技有限公司任君翔获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉太保科技有限公司申请的专利一种文本中实体关系的抽取方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115757736B

龙图腾网通过国家知识产权局官网在2026-01-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211479127.7,技术领域涉及:G06F16/3329;该发明授权一种文本中实体关系的抽取方法及相关装置是由任君翔;武悦娇;成臻设计研发完成,并于2022-11-23向国家知识产权局提交的专利申请。

一种文本中实体关系的抽取方法及相关装置在说明书摘要公布了:本申请公开了一种文本中实体关系的抽取方法及相关装置。采用了一种预先训练好的实体关系抽取模型对文本语料中各条文本的实体关系进行抽取。通过多个类型的标签矩阵的负采样结果作为数据标签对模型进行训练,能够极大概率过滤漏标数据对模型提取效果的影响。迭代更新的训练能够令模型逼近高质量标注的大规模语料的准确率效果。解决标注数据不够完备的场景中难以实现准确有效的实体关系提取的问题。将原本标注不够完备的文本语料逐渐完备化标注,避免了大量的标注工作,节省实体关系提取的成本。该方法非常适用于在低资源场景下实现实体的关系抽取。

本发明授权一种文本中实体关系的抽取方法及相关装置在权利要求书中公布了:1.一种文本中实体关系的抽取方法,其特征在于,包括: 利用文本语料构造包含多条文本的输入数据,将所述输入数据作为实体关系抽取模型的输入;所述多条文本包括无标注或者漏标注的文本;所述实体关系抽取模型包括编码器和图网络; 通过所述编码器对所述输入数据进行编码,并通过所述图网络对所述编码器输出的向量进行图计算,由所述图网络输出实体识别图结构矩阵、第一关系抽取图结构矩阵和第二关系抽取图结构矩阵; 利用所述实体识别图结构矩阵、所述第一关系抽取图结构矩阵和所述第二关系抽取图结构矩阵分别对所述输入数据逐条文本进行解码,得到各条文本的实体识别结果、关系头抽取结果和关系尾抽取结果; 根据实体识别结果、关系头抽取结果和关系尾抽取结果构建所对应文本的实体关系三元组抽取结果; 所述实体关系抽取模型为以所述多条文本各自对应的实体标签矩阵、第一关系标签矩阵和第二关系标签矩阵各自的负采样结果作为数据标签训练得到的模型,所述实体标签矩阵、所述第一关系标签矩阵和所述第二关系标签矩阵是基于所对应的文本以及关系库构建得到的三类标签矩阵; 目标标签矩阵为所述实体标签矩阵、所述第一关系标签矩阵和所述第二关系标签矩阵之一;对所述目标标签矩阵进行负采样得到对应的负采样结果,包括: 针对所述目标标签矩阵生成第一随机数矩阵; 根据所述实体标签矩阵中已标注的文本位置,在所述第一随机数矩阵中对应的位置加1,得到第二随机数矩阵; 将所述第二随机数矩阵中数值大于1-w的位置记1,将数值小于或等于1-w的位置记0,得到第三随机数矩阵;其中,w表示采样比例; 根据所述第三随机数矩阵对所述目标标签矩阵进行负采样,得到所述目标标签矩阵的负采样结果; 目标文本为所述多条文本之一;构建所述目标文本对应的所述实体标签矩阵、所述第一关系标签矩阵和所述第二关系标签矩阵,具体包括: 构建初始实体标签矩阵、初始第一关系标签矩阵和初始第二关系标签矩阵;初始实体标签矩阵、初始第一关系标签矩阵和初始第二关系标签矩阵中各位置标记为0; 遍历所述关系库,取得实体对中第一实体与第二实体的关系为第k关系;所述第k关系为所述关系库中的多种关系之一; 根据所述实体对在所述目标文本中的存在情况和存在位置,对初始实体标签矩阵、初始第一关系标签矩阵和初始第二关系标签矩阵进行重新标记处理,得到目标文本对应的实体标签矩阵、第一关系标签矩阵和第二关系标签矩阵; 所述根据所述实体对在所述目标文本中的存在情况和存在位置,对初始实体标签矩阵、初始第一关系标签矩阵和初始第二关系标签矩阵进行重新标记处理,得到目标文本对应的实体标签矩阵、第一关系标签矩阵和第二关系标签矩阵,具体包括: 若所述实体对中存在一个实体位于所述目标文本中,则定位存在的实体在所述目标文本中的首字位置和尾字位置作为横坐标和纵坐标,在初始实体标签矩阵的相应位置标记1; 若所述实体对中两个实体均位于所述目标文本中,则将所述第一实体的首字位置和所述第二实体的首字位置分别作为横坐标和纵坐标,在初始第一关系标签矩阵中第k关系的相应位置标记1;并将所述第一实体的尾字位置和所述第二实体的尾字位置分别作为横坐标和纵坐标,在初始第二关系标签矩阵中第k关系的相应位置标记1; 当针对所述目标文本遍历所述关系库结束,将标记完毕的初始实体标签矩阵、初始第一关系标签矩阵和初始第二关系标签矩阵分别作为所述目标文本对应的实体标签矩阵、第一关系标签矩阵和第二关系标签矩阵。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人太保科技有限公司,其通讯地址为:200010 上海市黄浦区中山南路1号11层(名义楼层)11V6室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。