南京大学黄书剑获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京大学申请的专利基于神经机器翻译模型的翻译方法、装置和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116090477B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211424398.2,技术领域涉及:G06F40/58;该发明授权基于神经机器翻译模型的翻译方法、装置和存储介质是由黄书剑;施超敏;陈家骏设计研发完成,并于2022-11-15向国家知识产权局提交的专利申请。
本基于神经机器翻译模型的翻译方法、装置和存储介质在说明书摘要公布了:本发明公开了基于神经机器翻译模型的翻译方法,翻译基于自回归解码的方式,每一步生成下一个词语,都是基于源端序列和已解码生成的目标端历史序列,自回归解码的每一步解码都包括如下:基于源端序列,通过神经机器翻译模型的编码器来获取基础源端表示和控制器源端表示;基于目标端历史序列和基础源端表示,获取基础目标端表示、神经机器翻译模型的解码器顶层交叉注意力层的模块权重和权重向量;基于解码器顶层交叉注意力层的权重向量,获取待翻译数字词,翻译为目标端数字词;基于基础目标端表示和翻译的目标端数字词,综合计算词语概率。本发明补强了神经机器翻译模型的数字翻译能力,解决对数字翻译的准确率缺乏保证,泛化能力差的问题。
本发明授权基于神经机器翻译模型的翻译方法、装置和存储介质在权利要求书中公布了:1.基于神经机器翻译模型的翻译方法,其特征在于:所述翻译基于自回归解码的方式,每一步生成下一个词语yj,都是基于源端序列和已解码生成的目标端历史序列Yj-1={y0,y1,…yj-1},所述自回归解码的每一步的解码过程中都包括以下步骤: S1:基于所述源端序列,通过神经机器翻译模型的编码器来获取基础源端表示和控制器源端表示; S2:基于所述目标端历史序列和所述基础源端表示,获取基础目标端表示、神经机器翻译模型的解码器顶层交叉注意力层的模块权重和权重向量; S3:基于所述神经机器翻译模型的解码器顶层交叉注意力层的权重向量,获取待翻译数字词,翻译为目标端数字词; S4:基于所述基础目标端表示和翻译的所述目标端数字词,综合计算词语概率; 所述基于所述源端序列,通过神经机器翻译模型的编码器来获取基础源端表示和控制器源端表示的具体步骤包括如下: 设源端序列X={x1,x2,…xm},i={1,2,…m},其中,xi表示源端句子中第i个子词,其中,源端序列采用BPE分词,数字词采用字符级分词; 将分词后的源端序列X输入至Transformer翻译模型的编码器中,编码得到基础源端表示向量序列E{e1,e2,…em},i={1,2,…m},其中,ei表示源端句子中第i个子词; 设源端数字标签序列Lsrc={l1,l2,…lm},i={1,2,…m},其中,li表示第i个子词是数字或数字的子词,若第i个子词不是数字或数字的子词,则li=0; 将所述源端数字标签序列Lsrc通过标签词向量编码,得到标签词向量序列El={el1,el2,…elm},i={1,2,…m},其中,eli表示第i个子词的数字标签词向量; 按元素连接基础源端表示向量与标签词向量,得到连接向量H0={h01,h02,…h0m},i={1,2,…m},其中,h0i=ei|eli,“|”表示向量连接,eli表示源语言句子中第i个子词对应的连接向量; 经过控制器编码器编码得到控制器源端表示H={h1,h2,…hm},所述控制器编码器构成如下: 其中,FFN表示全连接神经网络,acti表示任意激活函数; 所述基于所述神经机器翻译模型的解码器顶层交叉注意力层的权重向量,获取待翻译数字词,翻译为目标端数字词的具体步骤包括如下: 根据所述交叉注意力层的权重向量wj,得到权重最大的位置是这一步待翻译的子词,由此获得待翻译的数字词位置k=argmax(wj); 数字翻译模块通过规则获取包含源端第k个子词的完整数字词,若第k个子词不是数字词,则令tj=0,若第k个子词是数字词,则将该完整数字词输入数字翻译模块,以所述规则的方式翻译为目标语言的数字词Nj={nj 1,nj 2,…nj pj},其中,ni表示目标语言的数字词的第i个子词; 若在第j步前,已有翻译过的数字词Nl={nl 1,nl 2,…nl pl},且l+pl>j,则跳过翻译该完整数字词的步骤,否则令l:=j且Nl:=Nj。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京大学,其通讯地址为:210000 江苏省南京市栖霞区仙林大道163号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。