江苏电力信息技术有限公司栾宁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江苏电力信息技术有限公司申请的专利一种用于非结构化检测文本的信息抽取方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120670589B 。
龙图腾网通过国家知识产权局官网在2025-11-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511167960.1,技术领域涉及:G06F16/35;该发明授权一种用于非结构化检测文本的信息抽取方法及装置是由栾宁;程伟华;冯曙明;黄进;徐春雷;杨永成;宋港波;陶加贵;王涵;胡天牧;陈书敏;储昭杰设计研发完成,并于2025-08-20向国家知识产权局提交的专利申请。
本一种用于非结构化检测文本的信息抽取方法及装置在说明书摘要公布了:本发明提供一种用于非结构化检测文本的信息抽取方法装置,方法包括:获取待抽取的非结构化检测文本并进行预处理,获得检测文本序列;将检测文本序列输入至BERT模型进行深层语义编码,输出语义特征向量;将语义特征向量输入至SVM模型进行分类识别,从非结构化检测文本提取关键检测文本片段;将关键检测文本片段输入至LSTM‑CRF模型进行属性识别,输出检测文本属性信息;提取行业标准中相关的标准检测信息建立逻辑映射关系规则集,确定检测文本属性信息中各个信息元素之间的关联关系,形成信息关联规则集;根据信息关联规则集,构建检测事件信息链,该方法能够提高非结构化检测文本信息抽取的准确性。
本发明授权一种用于非结构化检测文本的信息抽取方法及装置在权利要求书中公布了:1.一种用于非结构化检测文本的信息抽取方法,其特征在于,包括: 获取待抽取的非结构化检测文本并进行预处理,获得预处理文本,对所述预处理文本进行编码,获得检测文本序列; 将所述检测文本序列输入至BERT模型进行深层语义编码,输出语义特征向量; 将所述语义特征向量输入至预先训练获得的SVM模型进行分类识别,根据分类识别结果从所述非结构化检测文本提取关键检测文本片段; 将所述关键检测文本片段输入至预先训练获得的LSTM-CRF模型进行属性识别,输出检测文本属性信息; 提取行业标准中相关的标准检测信息,根据所述标准检测信息建立逻辑映射关系规则集,根据所述逻辑映射关系规则集确定所述检测文本属性信息中各个信息元素之间的关联关系,形成信息关联规则集; 根据所述信息关联规则集,构建检测事件信息链:将所述信息关联规则集中的检测内容词语作为节点,关联关系作为边,根据节点之间的从属关系和因果关系,确定边的指向,获得关联关系有向图; 基于所述关联关系有向图,采用PageRank算法进行节点权重计算,获得每个节点的权重; 遍历每个节点,对每个当前节点,将与当前节点具有关联关系的节点中权重值最高的节点确定为最终关联节点,将当前节点和最终关联节点组成初始信息链; 根据初始信息链中的节点之间的指向以及节点在所述预处理文本中的前后位置关系进行节点的整合与排序,获得所述检测事件信息链; 所述节点的权重通过以下公式进行计算: ; 其中,PRui表示节点ui的权重,d表示阻尼因子,INui表示所有指向节点ui的节点集合,uj为集合INui中的一个节点,PRuj表示节点uj的权重,表示节点uj指向的节点数量,表示节点uj指向节点ui的权重系数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江苏电力信息技术有限公司,其通讯地址为:210000 江苏省南京市鼓楼区北京西路22号二、三层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励