Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 浙江大学苗晓晔获国家专利权

浙江大学苗晓晔获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉浙江大学申请的专利面向下游分析反馈的数据清洗方法及系统、电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119149903B

龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410979805.9,技术领域涉及:G06F18/10;该发明授权面向下游分析反馈的数据清洗方法及系统、电子设备是由苗晓晔;杨再润;吴洋洋;尹建伟设计研发完成,并于2024-07-22向国家知识产权局提交的专利申请。

面向下游分析反馈的数据清洗方法及系统、电子设备在说明书摘要公布了:本发明公开了一种面向下游分析反馈的数据清洗方法,包括:构建多层感知机分类器执行分类,生成软标签;脏数据结合软标签输入错误检测模型,输出特征向量形式的初步错误检测结果,通过聚类加权得聚类结果;选部分数据训练,分层抽样后输入多个同构错误检测模型,投票集成结果;利用交叉注意力机制的神经网络修补模型处理错误检测输出和脏数据,经特征提取、优化融合产出修正数据;下游模型反馈优化修补过程,获最终清洗数据。该方法主要通过基于深度学习的方法,对数据进行检测,并修复其中的脏数据,使得数据更加准确和可信。该方法能够根据下游任务的需求,对数据进行定制化处理,确保清洗后的数据能够直接应用于这些任务。

本发明授权面向下游分析反馈的数据清洗方法及系统、电子设备在权利要求书中公布了:1.一种面向下游分析反馈的数据清洗方法,其特征在于,包括: S1:构造一个多层感知机分类器作为下游任务模型; S2:将脏数据输入所述下游任务模型,进行分类任务,并输出分类结果的置信度,将所述置信度作为软标签,所述软标签包含下游任务的反馈信息;所述脏数据为包含温度、湿度和风速的气象脏数据; S3:将所述脏数据与软标签一同输入到错误检测模型中,所述错误检测模型首先用特征向量的形式组织错误检测结果,并根据生成的特征向量进行聚类,聚类的过程中使用所述软标签进行加权,最后根据聚类结果,选择出一部分数据样本作为训练样本; S4:将所述训练样本进行分层抽样后输入多个相同的错误检测模型中,收集不同错误检测模型的结果,使用投票法进行集成,得到最终的错误检测结果; S5:基于样本间交叉注意力机制构建Transformer神经网络模型,作为数据修补模型对所述脏数据进行特征表示; S6:将所述最终的错误检测结果以及脏数据输入修补模型,修补模型通过缺失数据插补任务以及原始数据重构任务进行训练,得到初步的数据修补结果; S7:根据所述反馈信息,持续优化修补结果,当修补模型收敛后得到最终的清洗结果; 其中,S5具体包括: S51:基于样本间交叉注意力机制,在样本间动态共享数据信息,并构建两个样本间交叉注意力块,将两个样本间交叉注意力块串行连接,让每个数据样本单元都能获得其所在行和所在列其余位置的数据信息; S52:通过所述样本间交叉注意力块进行基础特征修复,引入缺失掩码向量来创建一个能够直接应对和处理数据不完整性的机制,利用已有的完整数据来补充和改善缺失部分的表示; S53:在基础特征修复的基础上,通过第二个更深层次的注意力块对数据进行处理和额外的非线性变换,捕捉更复杂的数据关系和模式,进一步细化特征表示; S54:综合前两步的两个注意力块的输出,并根据数据的缺失情况动态调整它们的贡献度以生成最终的特征表征。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由AI智能生成
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。