上海淇毓信息科技有限公司付彪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海淇毓信息科技有限公司申请的专利海量数据中识别目标类型数据的方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115310514B 。
龙图腾网通过国家知识产权局官网在2026-01-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210790536.2,技术领域涉及:G06F18/2415;该发明授权海量数据中识别目标类型数据的方法及装置是由付彪;宋荣鑫;黄建庭;黄龙设计研发完成,并于2022-07-05向国家知识产权局提交的专利申请。
本海量数据中识别目标类型数据的方法及装置在说明书摘要公布了:本发明公开了一种海量数据中识别目标类型数据的方法、装置及电子设备,所述方法包括:根据数据仓库中数据表类型对应的抽样规则从数据表n个字段中分别抽取n个样本数据;将第i样本数据输入至字段识别模型的M个接口,得到第i样本数据在M个预设字段类型上的识别结果;根据第i样本数据在M个预设字段类型上的识别结果确定第i个字段判定为M个预设字段类型的概率;根据所述概率识别目标类型字段。本发明根据第i个字段判定为M个预设字段类型的概率从整体上识别目标类型字段,使识别结果更能反映字段抽样值整体的概率,而不仅仅是字段抽样值,使目标类型字段识别结果更为准确,加强了对敏感数据安全的保护,有效地避免敏感数据泄漏。
本发明授权海量数据中识别目标类型数据的方法及装置在权利要求书中公布了:1.一种海量数据中识别目标类型数据的方法,其特征在于,所述方法包括: 根据数据仓库中数据表类型对应的抽样规则从数据表n个字段中分别抽取n个json格式的样本数据; 将第i个样本数据根据json结构进行拆解,得到第i个样本数据的多个主键值;将每个主键值输入至字段识别模型的M个接口,得到每个主键值在M个预设字段类型上的识别结果;根据每个主键值在M个预设字段类型上的识别结果确定第i个样本数据在M个预设字段类型上的识别结果;其中:字段识别模型的每个接口对应识别一个预设字段类型; 根据第i个样本数据在M个预设字段类型上的识别结果确定第i个字段判定为第j个预设字段类型的概率; 根据所述概率识别目标类型字段; 配置每个预设字段类型的概率阈值;判断目标类型字段判定为第j个预设字段类型的概率是否大于第j个预设字段类型的概率阈值;若目标类型字段判定为第j个预设字段类型的概率大于第j个预设字段类型的概率阈值,则根据所述第j个预设字段类型标记目标类型字段的类型;根据所述目标类型字段的类型对所述目标类型字段进行脱敏处理; 其中:M、n、i均为大于零的自然数,且i小于等于n,j为大于零且小于等于M的自然数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海淇毓信息科技有限公司,其通讯地址为:201500 上海市崇明区横沙乡富民支路58号A1-5962室(上海横泰经济开发区);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励