上海熙软科技有限公司马朝阳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海熙软科技有限公司申请的专利基于深度迁移学习的跨语言文本分类与处理方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121478978B 。
龙图腾网通过国家知识产权局官网在2026-04-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610024281.7,技术领域涉及:G06F16/353;该发明授权基于深度迁移学习的跨语言文本分类与处理方法及系统是由马朝阳;刘莹莹;杨寻设计研发完成,并于2026-01-09向国家知识产权局提交的专利申请。
本基于深度迁移学习的跨语言文本分类与处理方法及系统在说明书摘要公布了:本发明提供基于深度迁移学习的跨语言文本分类与处理方法及系统,涉及文本处理技术领域,包括通过多层级语义迁移网络提取源语言和目标语言文本在不同语言学层级的特征表示,确定最优对齐路径进行非线性映射对齐获得融合特征,利用语义桥接函数传播类别语义并迭代更新目标语言文本的伪标签置信度分布,结合多任务学习模型完成分类。本发明有效解决跨语言场景下的文本分类问题,提高了低资源语言文本处理的准确性和效率。
本发明授权基于深度迁移学习的跨语言文本分类与处理方法及系统在权利要求书中公布了:1.基于深度迁移学习的跨语言文本分类与处理方法,其特征在于,包括: 获取待分类的目标语言文本数据、源语言标注文本数据;通过多层级语义迁移网络分别提取所述源语言标注文本数据与所述目标语言文本数据在不同语言学层级的特征表示,得到源语言多层级特征集合与目标语言多层级特征集合; 基于所述源语言多层级特征集合与目标语言多层级特征集合中特征维度数量的比值确定最优对齐路径,包括: 确定所述源语言多层级特征集合中各层级特征的第一特征维度数量与所述目标语言多层级特征集合中对应层级特征的第二特征维度数量的维度比值,当维度比值大于单位值时选择路径跳数为单跳或双跳的第一路径作为最优对齐路径,当维度比值小于单位值时选择路径跳数为三跳以上的第二路径作为最优对齐路径, 根据所述最优对齐路径将所述源语言多层级特征集合中各层级特征与所述目标语言多层级特征集合中对应层级特征进行非线性映射对齐,得到层级对齐后的融合特征; 将所述源语言标注文本数据的类别语义沿语义桥接函数传播至所述目标语言文本数据的特征空间,通过迭代更新所述目标语言文本数据的伪标签置信度分布,结合预先训练好的多任务学习模型确定所述目标语言文本数据的分类结果,包括: 从所述源语言标注文本数据中提取各类别的标注样本,对每个类别的标注样本进行聚类中心计算,得到各类别的源语言类别中心特征向量;利用所述语义桥接函数,对所述源语言类别中心特征向量进行空间变换操作,将其映射至目标语言特征空间得到目标语言类别参考特征向量;计算所述目标语言文本数据对应的特征与所述目标语言类别参考特征向量之间的特征相似度数值,对所述特征相似度数值进行归一化处理生成伪标签置信度分布向量;在每轮迭代中,将所述伪标签置信度分布向量与所述融合特征共同输入所述多任务学习模型,得到类别预测概率分布向量,将类别预测概率分布向量中概率值最大的类别作为所述目标语言文本数据的分类结果; 其中,所述多任务学习模型通过所述融合特征进行训练得到;根据所述分类结果对所述目标语言文本数据执行分类处理操作。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海熙软科技有限公司,其通讯地址为:200245 上海市闵行区昆阳路1508号2幢2层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励