杭州安恒信息技术股份有限公司秦坤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉杭州安恒信息技术股份有限公司申请的专利一种伪行数据的生成方法、装置、设备和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115712851B 。
龙图腾网通过国家知识产权局官网在2026-02-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211434565.1,技术领域涉及:G06F18/24;该发明授权一种伪行数据的生成方法、装置、设备和介质是由秦坤;范高源;莫凡设计研发完成,并于2022-11-16向国家知识产权局提交的专利申请。
本一种伪行数据的生成方法、装置、设备和介质在说明书摘要公布了:本申请公开了一种伪行数据的生成方法、装置、设备和介质,基于机器学习的分类任务,确定分类标签;原始数据中每行数据有其对应的一个分类标签。根据设定的伪行数据配置比例、原始数据中包含的所有分类标签的类型分布,设置各伪行数据对应的伪行分类标签。一个伪行数据由多个元素构成,一个元素即为一列数据中的一个数据。不同类型的列数据有其各自对应的数据生成规则。每种类型的分类标签下所依赖的各列数据会有所不同。依据伪行分类标签、原始数据中各列数据的分布情况以及各列数据对应的数据生成规则,构造伪行数据,使得伪行数据基本不会对原始数据的分布情况造成影响,从而降低了伪行数据对机器学习分类的影响。
本发明授权一种伪行数据的生成方法、装置、设备和介质在权利要求书中公布了:1.一种伪行数据的生成方法,其特征在于,包括: 基于机器学习的分类任务,确定分类标签;其中,原始数据中每行数据有其对应的一个分类标签; 根据设定的伪行数据配置比例、所述原始数据中包含的所有所述分类标签的类型分布,设置各伪行数据对应的伪行分类标签; 依据所述伪行分类标签、所述原始数据中各列数据的分布情况以及各列数据对应的数据生成规则,构造伪行数据; 其中,所述依据所述伪行分类标签、所述原始数据中各列数据的分布情况以及各列数据对应的数据生成规则,构造伪行数据包括: 根据所述伪行分类标签,确定出各所述伪行数据中各列数据对应的约束条件; 基于所述原始数据中各列数据的分布情况、各列数据对应的数据生成规则以及所述伪行数据中各列数据对应的约束条件,生成各伪列数据; 将各所述伪列数据按照所述原始数据中各列数据的顺序进行排布,以得到各所述伪行数据; 其中,所述基于所述原始数据中各列数据的分布情况、各列数据对应的数据生成规则以及所述伪行数据中各列数据对应的约束条件,生成各伪列数据包括: 在所述原始数据包括数值属性的列数据的情况下,对所述原始数据中具有同一目标分类标签的数值属性的目标列数据进行概率密度函数的估计;其中,所述目标列数据为所有所述数值属性的列数据中的任意一列数据; 基于与所述目标分类标签相同的目标伪行分类标签的个数,对估计后的概率密度函数进行采样,以得到目标伪列数据; 其中,所述依据所述伪行分类标签、所述原始数据中各列数据的分布情况以及各列数据对应的数据生成规则,构造伪行数据之后,还包括: 将所述伪行数据嵌入水印后插入到所述原始数据中。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州安恒信息技术股份有限公司,其通讯地址为:310000 浙江省杭州市滨江区西兴街道联慧街188号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励