四川大学沈晓东获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉四川大学申请的专利一种考虑局部与全局的用户负荷数据修复方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117093830B 。
龙图腾网通过国家知识产权局官网在2026-01-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310812473.0,技术领域涉及:G06F18/15;该发明授权一种考虑局部与全局的用户负荷数据修复方法是由沈晓东;赵俊豪;刘友波设计研发完成,并于2023-07-04向国家知识产权局提交的专利申请。
本一种考虑局部与全局的用户负荷数据修复方法在说明书摘要公布了:本发明涉及一种考虑局部与全局的用户负荷数据修复方法,属于负荷数据插补技术领域,局部插补模型利用数据点之间存在局部的相似性,基于局部相似性对缺失值进行插补;全局插补模型利用整个数据集的特征与分布信息,基于全局信息对缺失值进行插补。基于相似数据点的插补方法简单易用,但是受到局部相似性的限制,缺乏数据集的全局信息;基于全局模型的插补方法可以利用整个数据集的特征和分布信息,但计算复杂度较高,受极端数据点的影响较大。通过将二者结合,首先利用GCN挖掘数据的局部相似性,进行局部插补,再基于局部插补的结果使用GAN的对抗训练,进行全局插补。经实验验证,相比现有插补算法,本发明所提插补方法更加准确和稳定。
本发明授权一种考虑局部与全局的用户负荷数据修复方法在权利要求书中公布了:1.一种考虑局部与全局的用户负荷数据修复方法,其特征在于,包括下述步骤: S1、首先利用GCN挖掘数据的局部相似性,进行局部插补;即,局部插补模型利用数据点之间存在局部的相似性,基于局部相似性对缺失值进行插补; S2、再基于局部插补的结果使用GAN的对抗训练,进行全局插补;即,全局插补模型利用整个数据集的特征与分布信息,基于全局信息对缺失值进行插补; S3、最后进行实验仿真,验证将局部插补与全局插补相结合对插补性能提升的有效性; 步骤S1具体如下: 1计算相似度矩阵; 将原始数据集的每一个特征向量表示为图中的一个节点,然后计算各个节点之间的相似性,构成相似矩阵,对相似矩阵进行处理后得到邻接矩阵,根据邻接矩阵即可得到图结构的数据;基于欧氏距离的相似度计算公式如下: Sij=dxi☉Mi☉Mj,xj☉Mi☉Mj; 式中:d表示欧氏距离;⊙表示哈达玛积;M是二值掩码矩阵,用于表示数据是否缺失,若M=0,则表示数据缺失,反之则表示数据没有缺失,Mi是矩阵M的第i列; 通过对其最近的K个非缺失点的相似度进行处理,从而得到缺失点的相似度;设数据缺失点为xm,其最近的K个非缺失点为xik,根据高斯核函数计算缺失点的相似度表达式为: 式中:σ为高斯核函数的带宽参数; 由此得到一个相对完整的相似度矩阵Sij,对其进行阈值截取操作,以获得一个稀疏矩阵;对相似矩阵Sij的每一行从大到小进行排序,并指定一个分位数p,每一行只保留排名在前p%的值;如下式: 2构造GCN自编码器; 自编码器由编码器和解码器组成,编码器用于将原始输入x映射到一个低维空间h=encodex中进行中间表示,而解码器则将编码后的输入映射到原始维度空间中对输入进行重构:通过训练减少x与之间的误差;使用去噪自编码器;去噪自编码器接收有噪声的原始样本作为输入并对原始样本进行重构作为输出;在局部插补模型中,通过使用dropout层随机删除50%的输入后再作为去噪自编码器的输入,以完成对原始有缺失输入的重构; 利用GCN作为编码器和解码器,构建局部插补模型;在编码阶段的图卷积只涉及1阶邻居节点,在解码阶段的图卷积扩展到2阶邻居节点;在解码器部分加入一个跳过层和全局信息;在跳过层部分只考虑1阶邻居节点;在解码器中加入一个全局信息向量g,通过加权的方式将全局信息与每个节点相结合,加强节点表示的表达能力; 基于GCN的编码器和解码器的定义如下: 式中:是不考虑自连接的对称归一化拉普拉斯矩阵;g是全局信息向量,通过加权的方式将全局信息与每个节点相结合; 使用MSE作为自编码器的损失函数: 步骤S2具体如下: 考虑在使用GCN进行局部插补的基础之上将对抗性训练引入,构成全局插补模型;GAN由生成器和判别器组成,生成器负责生成伪造数据,而判别器负责对生成的伪造数据和真实数据进行区分,二者进行对抗训练,最终迫使生成的伪造数据的概率分布接近真实数据的概率分布;在全局插补模型当中,生成器使用基于GCN的自编码器,判别器使用多层感知机; 全局插补模型首先通过生成器进行局部插补得到填充后的数据,随后将X和输入到判别器中,判别器输出它们真实性的概率值,判别器和生成器通过训练反馈进行更新,再将对应的值去填充X的缺失部分完成数据的全局插补; GAN模型为WGAN-GP形式;WGAN-GP的损失函数为: 式中:E·为数学期望;Pxx和分别为真实数据x的概率分布和生成数据的概率分布;D·为判别器的函数;λ是梯度惩罚项的权重系数;其中ε为随机数; 生成器的损失函数在L1的基础上需要进行改动,变为: 在训练过程当中,设置判别器的权重每更新5次,生成器更新1次。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人四川大学,其通讯地址为:610000 四川省成都市一环路南一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励