科大国创云网科技有限公司李飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉科大国创云网科技有限公司申请的专利一种基于多任务学习知识增强的级联标签分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116204643B 。
龙图腾网通过国家知识产权局官网在2025-12-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310217721.7,技术领域涉及:G06F16/35;该发明授权一种基于多任务学习知识增强的级联标签分类方法是由李飞;王颜颜;陈政伊;冯强中;范文斌;周源;黄友志;丁常坤;程磊设计研发完成,并于2023-03-08向国家知识产权局提交的专利申请。
本一种基于多任务学习知识增强的级联标签分类方法在说明书摘要公布了:本发明公开了一种基于多任务学习知识增强的级联标签分类方法,属于自然语言处理技术领域,包括以下步骤:S1:语义表征;S2:多任务分类。本发明将预训练模型得到的上下文语义表征和义原知识表征相融合,同时加入了多任务学习的方法使得模型能够迭代训练,学习到不同标签之间的关系,提高了通用预训练语言模型在运营商投诉工单分类任务上的准确率。
本发明授权一种基于多任务学习知识增强的级联标签分类方法在权利要求书中公布了:1.一种基于多任务学习知识增强的级联标签分类方法,其特征在于,包括以下步骤: S1:语义表征 对投诉工单文本利用上下文编码器、知识增强编码器分别从上下文语境的角度和义原知识的角度进行语义表征,得到投诉工单文本的语义表征向量; S2:多任务分类 通过多任务学习分类器中四个对应于不同任务的分类器,根据不同分类器迭代的训练编码器所得到的共享语义表征,得到不同级别的分类标签; 在所述步骤S1中,上下文编码器为运营商领域投诉分类模型preBert,也即预训练模型preBert,利用预训练模型preBert对投诉工单数据进行训练得到基于上下文的语义表征,对于投诉工单文本序列t,通过已有的预训练模型preBert编码获得文本序列t的上下文语义表征向量定义如下: 其中,preBert·表示基于BERT模型的向量编码器; 在所述步骤S1中,知识增强编码器包括基于义原的知识学习模块和基于序列的知识编码模块,其中,基于义原的知识学习模块用于习得每一个词语基于义原层面的词表征,然后再基于序列的知识编码模块聚合获取知识增强的句子表征; 所述基于义原的知识学习模块的具体处理过程如下: S101:知识获取 统计所有文本序列中的词汇,构建词汇表V,其中包括N个词语,第i个词语表示为wi;通过查询中文知识库Hownet,可以获得第i个词语wi拥有p个词义第j个词义sj拥有q个义原 S102:义原表征获取 基于预训练模型preBert对义原进行编码获取对应的义原表征向量,分别为 S103:词义表征获取 假设代表词语wi的第j个词义嵌入,其是由该词义下所有义原嵌入向量表征组合获得,定义如下: 其中,是指词义sj中所有义原的集合,表示义原表征在组合成词语wi的第j个词义语义表征时每一个义原的重要性权重,表示词语wi基于预训练模型preBert编码获取的上下文向量表征,是词语wi中第j个词义的第k个义原的语义表征向量; S104:知识增强的词语表征获取 第i个词语基于知识的语义表征是通过整合词语的每一个词义的表征获取的;第i个词语基于知识的语义表征定义如下: 其中,表示词语wi的词义集合,表示在组合成单词wi语义表征时第j个词义的重要性权重,最终通过基于义原-词义的两层注意力的加权组合,获取每一个词语知识增强的语义表征; S105:构建知识表征向量矩阵 将词汇表V中所有词语都进行步骤S101~S104的操作,得到词汇表V中每一个词语知识增强的语义表征,构建词向量矩阵M,其中M∈RN×D,N是词典的大小,D是每一个词向量的维度; 所述基于序列的知识编码模块的具体处理过程如下: S201:通过聚合词语的知识增强的语义表征获取文本序列t的语义表征; S202:通过一个池化层将句子嵌入向量转换成与上下文编码器输出的表示向量相同的形式,定义为: 其中Pooler·表示池化函数; 在所述步骤S2中,多任务学习分类器的输入是将运营商投诉工单文本数据输入上下文编码器和知识增强编码器后得到的嵌入向量融合构成的,定义如下: 其中,t代表运营商投诉工单文本输入; 在所述步骤S2中,每个分类器均是一个全连接层,通过Argmax函数取最大概率值得到预测标签lmax,每个分类器的具体流程为: logits=Classifierzrt lmax=Argmaxlogits 其中,Classifierz·表示第z个分类器,Argmax·表示取最大概率的函数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人科大国创云网科技有限公司,其通讯地址为:230088 安徽省合肥市文曲路355号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励