淮阴工学院高尚兵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉淮阴工学院申请的专利基于Gate-Mixup数据增强的知识蒸馏化工文本分类方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115481249B 。
龙图腾网通过国家知识产权局官网在2025-07-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211156215.3,技术领域涉及:G06F16/353;该发明授权基于Gate-Mixup数据增强的知识蒸馏化工文本分类方法及装置是由高尚兵;张骏强;苏睿;王媛媛;张海艳;马甲林;张正伟;朱全银;蔡利荣;陈晓兵设计研发完成,并于2022-09-22向国家知识产权局提交的专利申请。
本基于Gate-Mixup数据增强的知识蒸馏化工文本分类方法及装置在说明书摘要公布了:本发明公开一种基于Gate‑Mixup数据增强的知识蒸馏化工文本分类方法及装置,首先同时对图神经网络教师模型以及Transformer学生模型进行初始训练;然后进行一阶段蒸馏训练,通过指标函数与门控单元对教师模型输出进行筛选,满足预设条件,则直接作为logits输入蒸馏损失函数指导学生模型,否则对文本表示进行数据增强,最后将输出残差叠加输入蒸馏损失函数指导学生模型训练;将教师模型与学生模型角色进行对调作为二阶段蒸馏训练,循环执行上述一阶段和二阶段蒸馏训练,最终获得蒸馏好的学生模型;实际应用时,将化工文本样本输入学生模型,获得预测输出文本类别。本发明通过构建的数据增强方法有效增强相互学习困难样本知识蒸馏效果,提升学生模型文本分类性能。
本发明授权基于Gate-Mixup数据增强的知识蒸馏化工文本分类方法及装置在权利要求书中公布了:1.一种基于Gate-Mixup数据增强的知识蒸馏化工文本分类方法,其特征在于,包括以下步骤: 1输入原始化工产品语料集,对语料集中的化工产品文本样本进行数据清洗以及预处理; 2基于从原始化工产品语料集中按照预设比例随机抽取的各化工产品样本文本,以及各化工产品样本文本分别对应预设分类下的相应真实类别,以化工产品样本文本为输入,化工产品样本文本所对应预设分类下相应类别为输出,同时对图神经网络教师模型以及Transformer学生模型进行初始训练,获得可以加载训练得到的初始权重的教师模型与学生模型; 3基于原始化工产品语料集中的化工产品样本文本,进行一阶段相互学习蒸馏知识训练,将样本文本按照预设批次数量输入加载了初始权重的教师模型,教师模型输出对应文本表示将文本表示输入教师分类器中输出获得文本样本的预测结果 4通过预设指标函数对预测结果进行指标评分,将获得的分数f1输入门控单元中,根据门控单元的预设阈值函数进行筛选,若阈值函数输出非零,则将教师模型输出的该文本表示作为教师模型logits的有效输出,通过第一蒸馏损失函数对学生模型进行蒸馏训练指导;否则对教师模型输出的文本表示进行数据增强,将文本表示与根据预设的dropout参数进行dropout操作后得到的教师模型输出的文本表示进行Mixup操作,获得数据增强后的文本表示 5将文本表示与原始文本表示进行残差叠加作为教师模型输出的logits,通过预设第一蒸馏损失函数对学生模型进行蒸馏训练指导; 6基于原始化工产品语料集中的化工产品样本文本,进行二阶段相互学习知识蒸馏训练,将样本文本按照预设批次数量输入加载了初始权重的学生模型,学生模型输出对应文本表示将文本表示输入学生分类器中输出获得文本样本的预测结果 7通过预设指标函数对预测结果进行指标评分,将获得的分数f2输入门控单元中,根据门控单元的预设阈值函数进行筛选,若阈值函数输出非零,则将学生模型输出的该文本表示作为学生模型logits的有效输出,通过第二蒸馏损失函数对教师模型进行蒸馏训练指导,否则对学生模型输出的文本表示进行数据增强,将文本表示与根据预设的dropout参数进行dropout操作后得到的学生模型输出的文本表示进行Mixup操作,获得数据增强后的文本表示 8将文本表示与原始文本表示进行残差叠加作为学生模型输出的logits,通过预设第二蒸馏损失函数对教师模型进行蒸馏训练指导; 9循环执行上述一阶段和二阶段相互学习知识蒸馏训练,直到达到预设的训练轮数,输出知识蒸馏训练好的学生模型;将化工产品文本样本输入学生模型,获得预测输出文本类别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人淮阴工学院,其通讯地址为:223003 江苏省淮安市经济技术开发区枚乘东路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。