大连理工大学姚琳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉大连理工大学申请的专利基于差分隐私的基因组数据生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117012273B 。
龙图腾网通过国家知识产权局官网在2025-09-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310981599.0,技术领域涉及:G16B20/20;该发明授权基于差分隐私的基因组数据生成方法是由姚琳;崔桂彰;吴国伟;闫泓淼设计研发完成,并于2023-08-07向国家知识产权局提交的专利申请。
本基于差分隐私的基因组数据生成方法在说明书摘要公布了:本发明属于信息安全技术领域,提供了一种基于差分隐私的基因组数据生成方法。本发明通过训练生成对抗网络来生成数据,在每一轮的迭代中首先依据真实数据在不平衡位点处的分布确定约束条件,将条件向量与潜变量一同作为生成器的输入,条件生成数据并计算损失更新生成器参数。然后采用自适应的隐私预算分配策略,依梯度大小和隐私损失调整分配的隐私预算,通过按分配的隐私预算对鉴别器梯度加噪的方式使模型满足差分隐私机制。最后通过计算总代价函数的梯度来判断是否达到最佳的隐私效用权衡点,如果梯度大于0则根据加噪后梯度更新鉴别器,继续开始新一轮的迭代,否则训练终止,输出此时的生成模型和生成数据。
本发明授权基于差分隐私的基因组数据生成方法在权利要求书中公布了:1.一种基于差分隐私的基因组数据生成方法,其特征在于,步骤如下: 1训练生成模型,采用条件生成的方式用生成器生成数据,根据生成数据分别计算用于条件生成的生成器的损失函数和对生成数据进行评价的鉴别器的损失函数,根据各自的损失函数更新生成器和鉴别器;SNPs数据条件生成的具体步骤如下: 1.1将数据持有者掌握的真实SNPs数据作为生成模型的训练数据集,首先计算训练数据集中每个SNPs位点的等位基因频率,找出其中等位基因频率低于阈值的不平衡SNPs位点; 在条件生成SNPs位点数据时,从不平衡SNPs位点中按相等的概率随机选择一个SNPs位点,再按照等位基因频率随机选择该SNPs位点处的取值,将该SNPs位点处的取值作为约束条件; 1.2将约束条件与随机高斯噪声即潜变量一同作为生成器的输入,按条件生成的方式生成数据; 鉴别器从生成模型的训练集中筛选出满足步骤1.1中约束条件即对应SNPs位点取值和约束条件相同的数据,从中随机进行采样,将采集到的真实数据和使用当前生成器条件生成的数据作为鉴别器的输入;鉴别器使用WGAN中的wassertein距离作为损失函数其中Pr表示真实数据分布,Pg表示生成数据分布;计算鉴别器的损失函数LD的梯度,按差分隐私保护策略添加噪声,更新鉴别器参数; 然后计算生成器的损失函数LG,依据链式求导法则计算生成器的损失函数对其参数的梯度并反向传播更新生成器参数; 生成器的损失函数:LG=LD+αLB+βLC 其中是巴氏距离,用来表示生成数据和真实数据间的遗传距离;Prxik和Pgxik分别是真实数据和生成数据在第i个SNPs位点处第k个等位基因的频率,q是第i个位点等位基因的总数,n是SNPs位点总数;是条件惩罚项,来迫使生成器学习按约束条件进行生成;α和β分别是巴氏距离和条件惩罚项对应的权重系数; 对生成模型进行隐私保护,通过对鉴别器梯度加噪实现差分隐私机制,选择合适的总隐私预算以获得好的隐私效用权衡; 1.3采用自适应的隐私预算分配策略,依梯度大小和隐私损失调整分配的隐私预算: 首先在训练开始前,选择一个初始隐私预算∈0;在训练过程中计算t次迭代的平均梯度大小,并检测重构误差计算隐私损失,并依据梯度的大小和隐私损失调整每隔t次迭代调整隐私预算为: 其中,E||gwx||2是两次调整间鉴别器损失函数梯度2-范数的期望,E||g0x||2是初始梯度2-范数的期望,Ploss是成员推理攻击下的隐私损失,r是预算增长率; 隐私损失Ploss根据训练集和非训练集样本在训练集中概率的差异来定义,通过重构误差即目标样本和重构样本的最小距离来计算,公式定义如下: 其中,xt是训练集样本,xv是非训练集样本;lt是目标训练样本的重构误差,lv是非训练集的平均重构误差; 通过对鉴别器的梯度进行添加方差为的高斯噪声,以满足∈,δ差分隐私;其中p是采样的比例,nd为一次迭代中鉴别器迭代的次数,∈是分配到的隐私预算,δ是差分隐私的松弛项; 1.4将鉴别器的损失函数LD作为生成数据的可用性损失Uloss,当生成数据的可用性满足要求后,根据隐私损失Ploss和可用性损失Uloss来计算总代价函数C:其中a和b是可用性和隐私性的权重;根据总代价C的梯度来判断是否需要终止迭代,若梯度大于0则继续迭代,否则训练终止,输出此时的生成模型和生成数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连理工大学,其通讯地址为:116024 辽宁省大连市甘井子区凌工路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。