语联网(武汉)信息技术有限公司蔡洁获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉语联网(武汉)信息技术有限公司申请的专利语料分类方法、垂直行业机器翻译方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114461799B 。
龙图腾网通过国家知识产权局官网在2025-07-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210089423.X,技术领域涉及:G06F16/353;该发明授权语料分类方法、垂直行业机器翻译方法及装置是由蔡洁设计研发完成,并于2022-01-25向国家知识产权局提交的专利申请。
本语料分类方法、垂直行业机器翻译方法及装置在说明书摘要公布了:本发明提供一种语料分类方法、垂直行业机器翻译方法及装置,该方法包括:基于目标平行语料库,获取各目标语料的原文分词和译文分词;基于原文分词和译文分词,获取第一原文句向量和第一译文句向量;将第一原文句向量和第一译文句向量,分别进行嵌入,获取第二原文句向量和第二译文句向量;基于第一原文句向量、第一译文句向量、第二原文句向量和第二译文句向量,计算得到目标相似度;在目标相似度大于或者等于目标阈值的情况下,目标语料的类型为第一目标类型。本发明提供的语料分类方法、垂直行业机器翻译方法及装置,能够依靠进行简单的向量计算,实现对不同语料的分类,操作简便,可解释性高。
本发明授权语料分类方法、垂直行业机器翻译方法及装置在权利要求书中公布了:1.一种语料分类方法,其特征在于,包括: 基于目标平行语料库,获取各目标语料的原文分词和译文分词; 基于所述原文分词和所述译文分词,获取第一原文句向量和第一译文句向量; 将所述第一原文句向量和所述第一译文句向量,分别进行嵌入,获取第二原文句向量和第二译文句向量;所述第一原文句向量是所述原文分词的向量之和构成,所述第一译文句向量是所述译文分词的向量之和构成,所述第二原文句向量为包含段落上下文语义信息的原文组句的文本表示,所述第二译文句向量为包含段落上下文语义信息的译文组句的文本表示; 基于所述第一原文句向量、所述第一译文句向量、所述第二原文句向量和所述第二译文句向量,计算得到目标相似度; 在所述目标相似度大于或者等于目标阈值的情况下,所述目标语料的类型为第一目标类型; 在所述目标相似度小于目标阈值的情况下,所述目标语料的类型为第二目标类型; 其中,所述第一目标类型与所述第二目标类型互斥; 其中,所述目标阈值用于划分所述目标语料的翻译风格类型,所述第一目标类型为“直译”翻译风格类型,所述第二目标类型为“意译”翻译风格类型,所述目标阈值是基于所述目标平行语料库设定,所述目标平行语料库的数量可以为一个或者多个,所述目标语料为所述目标平行语料库中的文本数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人语联网(武汉)信息技术有限公司,其通讯地址为:430206 湖北省武汉市江夏区东湖高新技术开发区高新大道999号武汉未来科技城B区B2栋B座;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。