全球能源互联网研究院有限公司;国网四川省电力公司;国家电网有限公司刘卫卫获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉全球能源互联网研究院有限公司;国网四川省电力公司;国家电网有限公司申请的专利一种数据资产质量检测方法和检测装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115481240B 。
龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110606566.9,技术领域涉及:G06F16/35;该发明授权一种数据资产质量检测方法和检测装置是由刘卫卫;雷舒雅;张文思;王晓慧;梁潇设计研发完成,并于2021-05-31向国家知识产权局提交的专利申请。
本一种数据资产质量检测方法和检测装置在说明书摘要公布了:本发明提供了一种数据资产质量检测方法和检测装置,该方法包括:获取待检测数据资产清单;对待检测数据资产清单进行关键词提取,构建关键词语料库;基于预设自定义词库对关键词语料库中的关键词进行特征类型的标注,并利用模型自动标注,构建检测特征关键词库;按照标注的特征类型,对检测特征关键词库与待检测数据资产清单进行映射,生成各数据资产特征清单;基于各特征类型对应的预设检测规则清单,分别对各数据资产特征清单进行数据资产质量检测,生成质量检测结果。根据标注的特征作为检测规则选取的索引,当数据质量检验时,能够快速的匹配出合适的检测规则,从而减少大量的重复工作,提高了数据质检的工作效率。
本发明授权一种数据资产质量检测方法和检测装置在权利要求书中公布了:1.一种数据资产质量检测方法,其特征在于,包括: 获取待检测数据资产清单; 对所述待检测数据资产清单进行关键词提取,构建关键词语料库;所述对所述待检测数据资产清单进行关键词提取,构建关键词语料库,包括:基于所述待检测数据资产清单的内容属性,从所述待检测数据资产清单进行语料提取,得到不同内容属性对应的语料;对所有语料进行分词;将分词后的结果作为关键词构建所述关键词语料库; 基于预设自定义词库对所述关键词语料库中的关键词进行特征类型的标注,构建检测特征关键词库;所述基于预设自定义词库对所述关键词语料库中的关键词进行特征类型的标注,构建检测特征关键词库,包括:从所述关键词语料库中选取第一预设比例的关键词作为训练样本;利用所述预设自定义词库中的自定义词作为特征类型对所述训练样本进行标注;将带有标注的训练样本输入预设特征类型标注模型进行训练,得到训练好的预设特征类型标注模型;利用训练好的预设特征类型标注模型对所述关键词语料库中所有关键词进行特征类型标注,得到所述检测特征关键词库; 按照标注的特征类型,对所述检测特征关键词库与所述待检测数据资产清单进行映射,生成各数据资产特征清单;所述按照标注的特征类型,对所述检测特征关键词库与所述待检测数据资产清单进行映射,生成各数据资产特征清单,包括:利用模糊查询、相似计算和或多结果融合将检测特征关键词库与数据资产清单进行映射,以使所述数据资产清单每个表和每个字段均能映射到检测特征关键词库中的特征,生成表级和字段级的数据资产特征清单;所述按照标注的特征类型,对所述检测特征关键词库与所述待检测数据资产清单进行映射,生成各数据资产特征清单,包括:获取所述检测特征关键词库中当前特征类型对应的关键词;利用所述当前特征类型对应的关键词与所述待检测数据资产清单进行映射;根据映射结果生成所述当前特征类型对应的当前数据资产特征清单; 基于各特征类型对应的预设检测规则清单,分别对各数据资产特征清单进行数据资产质量检测,生成质量检测结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人全球能源互联网研究院有限公司;国网四川省电力公司;国家电网有限公司,其通讯地址为:102209 北京市昌平区未来科技城滨河大道18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励