Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 国网江苏省电力有限公司苏州供电分公司;南京大全电气研究院有限公司潘晓明获国家专利权

国网江苏省电力有限公司苏州供电分公司;南京大全电气研究院有限公司潘晓明获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉国网江苏省电力有限公司苏州供电分公司;南京大全电气研究院有限公司申请的专利变电主设备多源异构数据的知识图谱构建方法及相关系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119474148B

龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411441208.7,技术领域涉及:G06F16/2455;该发明授权变电主设备多源异构数据的知识图谱构建方法及相关系统是由潘晓明;邵斌;邓立晨;许琛雍;王国凤;樊佳辉;赵耀;何山;田雨;濮睿;沈美燕;魏雨萱;孙大军设计研发完成,并于2024-10-16向国家知识产权局提交的专利申请。

变电主设备多源异构数据的知识图谱构建方法及相关系统在说明书摘要公布了:本发明涉及数据处理技术领域,具体为变电主设备多源异构数据的知识图谱构建方法及相关系统,包括多源异构数据采集,对于结构化的数据库数据,采用数据库连接工具,通过编写SQL查询语句获取所需数据;对于半结构化数据利用相应的解析库进行解析提取关键信息,并转化为结构化数据格式;对于非结构化的文本数据和网页数据,采用自然语言处理技术和网络爬虫技术;本发明变电主设备多源异构数据的知识图谱构建方法,提高了数据利用率,在数据二级处理中通过引入数据增强算法,能够对数据进行增强补充。

本发明授权变电主设备多源异构数据的知识图谱构建方法及相关系统在权利要求书中公布了:1.变电主设备多源异构数据的知识图谱构建方法,其特征在于,该方法包括以下步骤: S1、多源异构数据采集,对于结构化的数据库数据,采用数据库连接工具,通过编写SQL查询语句获取所需数据;对于半结构化数据利用相应的解析库进行解析提取关键信息,并转化为结构化数据格式;对于非结构化的文本数据和网页数据,采用自然语言处理技术和网络爬虫技术,网络爬虫使用Scrapy框架,根据设定的目标网址和数据提取规则进行数据采集,对于非结构化文本数据采集后存储在本地文件或数据库中等待后续处理; S2、数据初级处理,所述数据初级处理分为结构化数据处理、半结构化数据处理和非结构化数据处理; 结构化数据处理:进行数据清洗,去除重复记录,通过编写数据库查询语句或使用数据处理工具,对比关键字段,识别并删除重复的记录行;纠正错误格式,对于日期格式不统一的情况,将其统一转换为标准格式;对于数值型数据中存在的异常值,如明显超出正常范围的温度值,通过设定合理的阈值范围进行筛选和修正; 数据集成,将从不同数据库表或系统中获取的相关结构化数据进行整合,将设备管理系统中的设备基本信息与监测系统中的运行数据通过设备编号等关键字段进行关联合并,形成一个包含设备多方面信息的数据集; 半结构化数据处理:进行格式转换,对于XML格式的检修报告,解析XML节点内容,提取关键信息,并将其转换为结构化表格形式;对JSON格式的设备配置文件,解析其中的键值对信息,提取设备参数配置信息,转换为便于处理的结构化格式; 数据规范化,对提取出来的半结构化数据内容进行规范化处理; 非结构化数据处理:文本清洗,去除标点符号、特殊字符、无意义字符噪声,采用中文分词工具对文本进行分词处理,将连续的文本分割成词语序列,去除常见的无实际意义的停用词; 文本标注,对于巡检记录、故障描述文本数据,进行人工标注或采用有监督的机器学习算法进行标注,识别其中的设备实体、状态描述关键信息; S3、数据二级处理,引入数据增强算法,设置生成器和判别器,在多源异构数据处理中,生成器用于生成与真实数据相似的新数据,判别器用于区分真实数据和生成数据,通过两者的对抗博弈,生成器不断提高生成数据的质量,从而实现数据增强,对数据量较少的数据源进行补充; S4、对S3中获取的数据进行知识抽取,其包括实体抽取、关系抽取和属性抽取,实体抽取通过制定规则模板来识别实体;关系抽取通过构建神经网络模型,采用卷积神经网络CNN或循环神经网络RNN及其变体构建关系抽取模型,模型输入为包含两个实体的句子文本向量表示,经过网络层学习句子语义特征,输出实体之间的关系类型结果;属性抽取分为从结构化数据提取和从非结构化数据提取,从结构化数据提取时直接从数据库表字段中获取设备的固有属性信息,对于半结构化数据中明确标记的属性信息,按照格式解析提取,从非结构化数据提取时定义属性提取规则模板,当文本符合模板规则时,提取相应的属性信息,同时结合自然语言处理技术进行语义分析,提高属性提取的准确性; S5、进行知识融合,所述知识融合包括本体构建、实体对齐和冲突检测消解; S6、知识图谱形成,通过图数据库存储抽取和融合后的知识,将实体作为节点存储其属性信息,将关系作为边存储关系的属性和方向信息,形成知识图谱,所述图数据库存包括Neo4j和JanusGraph; S7、优化突出处理,通过优化算法根据知识图谱节点的特征和邻居节点的信息为节点分配不同的注意力权重,在变电设备知识图谱中,一些关键设备节点和具有重要连接关系的节点对整个系统的运行和故障传播有重要影响,通过算法识别出这些重要节点并赋予更高的注意力权重; S8、应用实现,基于S7中进一步优化突出处理后的知识图谱实现设备故障诊断、分析、运维策略优化; S3中所述数据增强算法具体如下: 生成器G接收随机噪声z和部分变电设备数据特征作为输入,生成新的数据样本,判别器D接收真实数据或生成数据,输出一个概率值,表示输入数据为真实数据的概率,判别器的目标是最大化正确区分真实数据和生成数据的概率,而生成器的目标是使判别器无法区分生成数据和真实数据; 判别器的损失函数和生成器的损失函数分别定义如下: ; 其中,是真实数据的分布,是随机噪声的分布,通过交替训练判别器和生成器,不断优化它们的参数,使得生成的数据能够更好的模拟真实数据的分布,增强多源异构数据的多样性和完整性。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网江苏省电力有限公司苏州供电分公司;南京大全电气研究院有限公司,其通讯地址为:215004 江苏省苏州市劳动路555号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。