山东省林业保护和发展服务中心;临沂市森林和草原防火服务中心;青岛国测海遥信息技术有限公司李佳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东省林业保护和发展服务中心;临沂市森林和草原防火服务中心;青岛国测海遥信息技术有限公司申请的专利基于命名实体识别与关系抽取的林区火灾知识建模方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121524352B 。
龙图腾网通过国家知识产权局官网在2026-03-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610049274.2,技术领域涉及:G06F16/35;该发明授权基于命名实体识别与关系抽取的林区火灾知识建模方法是由李佳;于海涛;唐帅;李长江;赵剑强;权宗堂;刘金龙;艾钊;王崇阳;李大鹏;姜雨佳;陈铁山;刘晓红;尹潇设计研发完成,并于2026-01-15向国家知识产权局提交的专利申请。
本基于命名实体识别与关系抽取的林区火灾知识建模方法在说明书摘要公布了:本发明涉及一种基于命名实体识别与关系抽取的林区火灾知识建模方法,具体如下:先收集林区火灾领域原始文本数据,经预处理及实体与关系标注构建文本数据集;再构建命名实体识别与关系抽取模型,通过多粒度自适应分词、动态标准化及预训练语言模型编码器特征增强,实现林区火灾知识的实体识别与关系抽取以获取三元组全局置信度;再采用多任务联合训练框架,计算模型的损失函数,基于损失函数对模型端到端优化模型参数;再将新的林区火灾文本输入训练好的模型,筛选高置信度关系三元组;最终基于抽取的三元组构建结构化林区火灾领域知识图谱。本发明能高效挖掘林区火灾领域知识,为林区火灾防控等提供精准知识支撑。
本发明授权基于命名实体识别与关系抽取的林区火灾知识建模方法在权利要求书中公布了:1.一种基于命名实体识别与关系抽取的林区火灾知识建模方法,其特征是,包括以下步骤: S1、收集林区火灾领域的原始文本数据构建原始文本语料库,对原始文本资料库中数据进行清洗和预处理,再对数据中实体和关系进行标注,构成文本数据集,其中包含文本内容、实体标注及实体关系三元组列表; S2、构建命名实体识别与关系抽取模型,对文本数据集中的文本数据进行多粒度自适应分词与动态标准化,生成标准化多粒度词序列,接着基于预训练语言模型编码器对标准化多粒度次序列进行特征增强,在进行面向林区火灾知识的实体识别与关系抽取,得到实例和关系的三元组全局置信度; S2.1、多粒度自适应分词与动态标准化操作具体如下: S2.1.1、基于文本数据集中文本内容,通过谱聚类算法分别构建字符级、词级、短语级三个预设粒度层级的领域词典,并为每个词典分段初始化滑动窗口中心点与宽度参数;预设粒度层级总数,用于组织多尺度词典结构,分别对应字符、词、短语三个语义尺度,设置表示粒度层级索引,取1、2、3时分别表示字符级、词级、短语级; 通过谱聚类算法将领域文本向量动态划分为个簇,表示第个粒度层级的词典分段总数,第个粒度层级第个词典分段表示为,表示第个粒度层级内的词典分段索引;第个粒度层级第个词典分段的聚类中心向量表示为,第个粒度层级第个词典分段的中心点参数表示为,第个粒度层级第个词典分段的窗口宽度参数表示为; S2.1.2、根据当前文本内容的全局语义向量与各词典分段聚类中心的距离,动态计算每个词典分段在当前分词过程中的权重系数; 其中,将当前文本内容的字符串输入至预训练的BERT语言模型,获取其[CLS]标记的最终隐藏状态向量,或对所有标记的隐藏状态进行平均池化,得到全局语义向量表示; S2.1.3、通过结合高斯核与非线性调节函数的滑动窗口函数,动态确定各粒度层级分词操作的上下文范围; 每个粒度层级的自适应滑动窗口函数的输入为当前文本的长度偏移量,由字符串长度减去中心点参数后除以窗口宽度参数得到;每个粒度层级的自适应滑动窗口函数的输出用于调制该粒度层级分词的强度或置信度; S2.1.4、通过匹配与转换函数将原始文本与各粒度层级的词典分段进行多模式匹配,再将匹配结果转换为对应的特征向量表示; 匹配与转换函数中包括匹配模式函数和嵌入转换函数,匹配模式函数基于不同模式的匹配输出不同的匹配得分,嵌入转换函数用于将匹配到的文本片段转换为固定维度的特征向量; S2.1.5、集成各粒度层的权重系数、自适应滑动窗口函数的输出、匹配与转换函数的输出,通过拼接操作生成标准化多粒度词序列表示矩阵; S3、采用多任务联合训练框架,基于标注数据和模型预测结果,计算模型的总损失函数,总损失函数由实体识别复合损失、关系抽取自适应对比损失以及多粒度一致性正则化损失三部分构成,通过端到端方式联合优化模型参数,得到训练好的模型; S4、将新的、未经标注的林区火灾领域文本输入至训练好的模型中,进行命名实体识别与关系抽取,得到每个实体的最终类型预测,进而得到实例和关系的三元组全局置信度,选择置信度高于预设阈值的关系三元组作为最终抽取结果; S5、基于从大量林区火灾文本中抽取出的关系三元组,构建结构化的林区火灾领域知识图谱。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东省林业保护和发展服务中心;临沂市森林和草原防火服务中心;青岛国测海遥信息技术有限公司,其通讯地址为:250000 山东省济南市历下区二环东路5948号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励