山东蟠龙信息科技有限公司李光辉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东蟠龙信息科技有限公司申请的专利一种基于数据隐私的跨院校实训数据共享方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121277901B 。
龙图腾网通过国家知识产权局官网在2026-02-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511852291.1,技术领域涉及:G06F16/176;该发明授权一种基于数据隐私的跨院校实训数据共享方法是由李光辉;田硕磊;张磊;胡依良设计研发完成,并于2025-12-10向国家知识产权局提交的专利申请。
本一种基于数据隐私的跨院校实训数据共享方法在说明书摘要公布了:本申请公开了一种基于数据隐私的跨院校实训数据共享方法,涉及数据共享技术领域,参与数据共享的各院校在本地数据上训练模型并在梯度更新中添加差分隐私噪声;为本地模型生成软标签作为上传信息并上至与各院校通信的服务器;服务器根据接收的软标签的数据量、本地验证准确率与梯度范数动态加权聚合软标签获得全局软标签;服务器使用全局软标签训练全局模型并下发给各院校。参与数据分享的院校只需要采用本地的实训数据训练本地模型,训练完成后利用能够代表实训数据特征的本地模型生成软标签参与到后期全局训练和最终的训练数据分享。这样参与数据共享的每个院校均不需要直接使用原始的实训数据,即可完成不同院校大规模实训数据的安全共享。
本发明授权一种基于数据隐私的跨院校实训数据共享方法在权利要求书中公布了:1.一种基于数据隐私的跨院校实训数据共享方法,其特征在于,包括: 参与数据共享的各院校在本地数据上训练模型并在梯度更新中添加差分隐私噪声,包括: 各院校对本地实训数据进行预处理并通过特征对齐算法进行特征对齐; 基于预处理后的本地实训数据在本地进行模型训练,并在参数更新中添加差分隐私噪声; 所述各院校对本地实训数据进行预处理并通过特征对齐算法进行特征对齐,包括: 各院校首先对本地实训数据进行清洗,通过缺失值插补、异常值剔除与重复记录去重完成基础质量提升; 随后对数值型字段做Z-score标准化,使均值归零、方差归一,对类别型字段采用独热或目标编码,保证量纲一致; 接着启动特征对齐算法将公共参考样本的核密度估计分布广播至各院校; 本地构造可逆变换网络T,以Wasserstein-1距离为损失,通过梯度惩罚WGAN-GP训练T直至本地分布与的推前测度差异小于设定阈值; 训练完成后,各院校将原始特征逐条输入T得到对齐表示,形成与全局特征空间同维、同分布的清洗标准化对齐数据集,为后续联邦训练提供统一输入; 为本地模型生成软标签作为上传信息并上至与各院校通信的服务器,包括: 各院校在完成本地差分隐私训练后,为训练完成的本地模型生成软标签:,其中:为归一化函数,为本地模型,为公共无标签样本,为用于软化分布的参数,为公共数据集; 将所述软标签连同本地验证准确率、数据量、梯度范数打包成加密消息,通过双向mTLS通道上传至服务器,完成知识蒸馏环节的上传; 所述服务器根据接收的所述软标签的数据量、本地验证准确率与梯度范数动态加权聚合所述软标签获得全局软标签,包括: 利用接收的各院校上传的本地验证准确率、数据量和梯度范数和相应的权重系数计算每个院校的综合贡献得分:,其中:为数据量,为本地验证准确率,为梯度范数,为数据量权重系数,为本地验证准确率权重系数,为梯度范数权重系数,为院校i的本地样本数,为所有院校样本总数,为缩放因子,用于将梯度范数映射到sigmoid敏感区间,表示梯度范数归一化; 将所述综合贡献得分进行归一化得到动态权重:,表示所有院校的综合贡献得分总和; 随后以该权重对所有院校的软标签进行加权平均聚合,生成全局软标签:; 所述服务器使用所述全局软标签训练全局模型并下发给各院校。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东蟠龙信息科技有限公司,其通讯地址为:250101 山东省济南市中国(山东)自由贸易试验区济南片区虎山北路1001号智能传感器(济南)创新中心4-8室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励